相關(guān)申請(qǐng)
本申請(qǐng)根據(jù)35u.s.c.§119(e)要求2015年1月30日提交的美國臨時(shí)申請(qǐng)?zhí)?2/110,050的權(quán)益,其全部內(nèi)容通過引用并入本文。
聯(lián)邦資助研究
本發(fā)明是在國家衛(wèi)生研究院授予的基金號(hào)1dp2od007292-01、1r21hd072481-01和1r01eb018659-01、國家科學(xué)基金會(huì)授予的基金號(hào)ccf1162459、ccf1054898和ccf-1317291、海軍研究所授予的基金號(hào)n00014-13-1-0593/n00014-14-1-0610和n00014-11-1-0914由政府支持完成的。政府對(duì)發(fā)明有一定的權(quán)利。
背景技術(shù):
使用顯微鏡在單分子分辨率下對(duì)活體的復(fù)雜分子系統(tǒng)的相關(guān)分子進(jìn)行同時(shí)成像是具有挑戰(zhàn)性的,特別是在高通量和多重分析方面。此外,通常用于解析分子相互作用的其他技術(shù),例如共同免疫沉淀和鄰近連接,是固有的破壞性的,這阻止了闡明個(gè)體分子網(wǎng)絡(luò)所需的重復(fù)取樣。
技術(shù)實(shí)現(xiàn)要素:
在一些方面,在本文中提供了成像分子而不使用顯微鏡或其他專門設(shè)備的方法。這樣的方法在本文稱為“無顯微鏡成像(mfi)”方法。目前的成像技術(shù)以“自上而下”的方式使用顯微鏡來探測分子靶。在本文中,以“自下而上”的方式使用“分子設(shè)備”(例如,基于dna的和基于蛋白質(zhì)的分子)而不是顯微鏡來檢查分子靶。本公開內(nèi)容的方法提供了相對(duì)于當(dāng)前顯微鏡成像技術(shù)的更高的空間分辨率(例如,可視化生物結(jié)構(gòu)以及各個(gè)網(wǎng)絡(luò)內(nèi)的真實(shí)連通性和動(dòng)態(tài)數(shù)據(jù)),更高的復(fù)用能力和更高的通量分析。此外,本公開內(nèi)容的方法提供了分子靶在其天然狀態(tài)下的的原位獲取。
本公開內(nèi)容的一些方面提供核酸條形碼化探針,其包括布置成形成具有部分雙鏈引物結(jié)合區(qū)、雙鏈條形碼區(qū)、雙鏈回文區(qū)和含有靶結(jié)合部分的單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)的核酸,其中終止聚合的合成的非dna接頭位于雙鏈回文區(qū)和環(huán)區(qū)之間。
本公開內(nèi)容的一些方面提供核酸條形碼化探針,其包含一個(gè)或多個(gè)核酸鏈,所述一個(gè)或多個(gè)核酸鏈被布置成:(a)雙鏈回文區(qū);(b)雙鏈條形碼區(qū);和(c)引物結(jié)合區(qū)。
在一些實(shí)施方案中,核酸條形碼化探針包含第一核酸鏈,其包含第一回文序列,第一條形碼序列和引物結(jié)合序列,以及第二核酸鏈,其包含與第一回文序列互補(bǔ)并結(jié)合的第二回文序列和與第一條形碼序列互補(bǔ)并結(jié)合的第二條形碼序列,其中第一核酸鏈和第二核酸鏈通過接頭(例如,非核酸接頭,或連續(xù)的核酸片段)彼此連接,并且布置成雙鏈回文區(qū),雙鏈條形碼區(qū)和部分雙鏈(或單鏈)引物結(jié)合區(qū)(例如,形成發(fā)夾環(huán)結(jié)構(gòu),如圖5所示的結(jié)構(gòu))。
在一些實(shí)施方案中,引物結(jié)合區(qū)是單鏈的。在一些實(shí)施方案中,引物結(jié)合區(qū)是部分雙鏈的。
在一些實(shí)施方案中,雙鏈回文區(qū)具有4至10個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈條形碼區(qū)具有2至100個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,引物結(jié)合區(qū)具有4至40個(gè)核苷酸的長度。
在一些實(shí)施方案中,條形碼化探針進(jìn)一步包括與雙鏈回文區(qū)鄰近的終止聚合的分子或修飾。如果兩個(gè)核酸區(qū)在彼此的0至10個(gè)核苷酸之間,則認(rèn)為彼此“鄰近”或“鄰近”。在一些實(shí)施方案中,如果兩個(gè)區(qū)之間沒有核苷酸,例如兩個(gè)區(qū)彼此連續(xù),則認(rèn)為兩個(gè)區(qū)彼此“緊鄰”。
在一些實(shí)施方案中,條形碼化探針進(jìn)一步包括鄰近雙鏈回文區(qū)的終止聚合的合成非dna接頭。例如,條形碼化探針還可以包含與雙鏈回文區(qū)鄰近的三乙二醇間隔子(spacer),其終止聚合。
在一些實(shí)施方案中,條形碼化探針包含與終止聚合的分子或修飾鄰近的雙鏈置換區(qū)。雙鏈置換區(qū)可以具有例如2至10個(gè)核苷酸堿基對(duì)的長度。
在一些實(shí)施方案中,條形碼化探針被布置成形成包含單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)。單鏈環(huán)區(qū)可以具有例如3至50個(gè)核苷酸的長度。
在一些實(shí)施方案中,條形碼化探針還包含靶結(jié)合部分。在一些實(shí)施方案中,靶結(jié)合部分附接到單鏈環(huán)區(qū)。
在一些實(shí)施方案中,靶結(jié)合部分選自:生物素(例如,作為抗生物素蛋白或鏈霉親和素的結(jié)合配偶體),抗體(或抗體片段,例如fc片段),適體,納米體,核酸,藥物和原子。“適體”是結(jié)合特定分子靶的寡核酸或肽分子。dna,rna或xna適體通常包括短(例如5至30個(gè)核苷酸)的寡核苷酸鏈。肽適體通常包括兩端附接于蛋白質(zhì)支架的短可變肽結(jié)構(gòu)域?!凹{米體”是包含單個(gè)單體可變抗體結(jié)構(gòu)域并且能夠選擇性結(jié)合分子靶的單結(jié)構(gòu)域抗體(也稱為抗體片段)。
在一些實(shí)施方案中,條形碼化探針包含至少一個(gè)鎖核酸(lna)核苷酸。lna可以位于例如雙鏈條形碼區(qū)中或鄰近雙鏈條形碼區(qū)。
在一些實(shí)施方案中,條形碼化探針還包含單鏈多聚t(或多聚a)末端序列(例如,在3'末端或5'末端)。
在一些實(shí)施方案中,條形碼化探針通過靶結(jié)合部分與分子靶結(jié)合。
本公開內(nèi)容的一些方面提供了多個(gè)如本文提供的核酸條形碼化探針。
在一些實(shí)施方案中,雙鏈回文區(qū)對(duì)于多個(gè)核酸條形碼化探針的每個(gè)探針是相同的。
在一些實(shí)施方案中,雙鏈條形碼區(qū)對(duì)于多個(gè)核酸條形碼化探針的每個(gè)探針是唯一的。
在一些實(shí)施方案中,多個(gè)核酸條形碼化探針包括條形碼化探針的子集,每個(gè)子集包括獨(dú)特的條形碼區(qū)。
在一些實(shí)施方案中,引物結(jié)合區(qū)對(duì)于多個(gè)核酸條形碼化探針的每個(gè)探針是相同的。
在一些實(shí)施方案中,引物結(jié)合區(qū)對(duì)于多個(gè)核酸條形碼化探針的條形碼化探針的每個(gè)子集是獨(dú)特的。
在一些實(shí)施方案中,多個(gè)核酸條形碼化探針的每個(gè)探針通過靶結(jié)合部分與分子靶結(jié)合。
本公開內(nèi)容的一些方面提供了包含本文提供的多個(gè)條形碼化探針以及與多個(gè)核酸條形碼化探針的探針的引物結(jié)合區(qū)至少部分互補(bǔ)的引物的組合物。
在一些實(shí)施方案中,引物包含相對(duì)于引物結(jié)合區(qū)的至少一個(gè)核苷酸錯(cuò)配。
在一些實(shí)施方案中,引物包含至少一個(gè)與引物結(jié)合區(qū)不互補(bǔ)和/或不結(jié)合引物結(jié)合區(qū)的人造接頭。
在一些實(shí)施方案中,組合物還包含鏈置換聚合酶。例如,組合物可以包含選自以下的鏈置換聚合酶:bsudna聚合酶,大片段;phi29聚合酶;deepventr聚合酶;klenow片段聚合酶;和修飾的taq聚合酶。
在一些實(shí)施方案中,組合物還包含輔助核酸鏈,所述輔助核酸鏈與所述單鏈引物結(jié)合區(qū)部分互補(bǔ),與鄰近所述引物結(jié)合區(qū)的單鏈區(qū)部分互補(bǔ),并且與鄰近所述引物結(jié)合區(qū)的所述單鏈區(qū)短暫地結(jié)合。在一些實(shí)施方案中,輔助鏈長度為3至20個(gè)核苷酸。
本公開內(nèi)容的一些方面提供檢測分子靶相互作用的方法。在一些實(shí)施方案中,所述方法包括以下步驟:(a)在單個(gè)反應(yīng)中將多個(gè)核酸條形碼化探針與(i)與多個(gè)核酸條形碼化探針的探針的引物結(jié)合區(qū)互補(bǔ)的引物和(ii)鏈置換聚合酶組合,和(b)在導(dǎo)致產(chǎn)生條形碼化記錄物的條件下孵育反應(yīng)。
在一些實(shí)施方案中,條形碼化記錄物是雙鏈的。
在一些實(shí)施方案中,(b)的步驟包括在生理?xiàng)l件下孵育樣品?!吧?xiàng)l件”包括20-40攝氏度(℃)的溫度范圍(例如20-25℃,20-30℃,20-35℃,25-40℃,25-35℃,25-30℃,30-40℃,35-40℃或37℃),ph為6-8(例如ph6,6.5,7,7.5或8),鈉濃度為0-1m(通常為145mm),并且鎂濃度為0-20mm(例如,1-2mm)。因此,在一些實(shí)施方案中,(b)的步驟包括在37℃的溫度下將樣品在含有2mm濃度的鎂的緩沖液中孵育。在一些實(shí)施方案中,緩沖液可商購,例如“1xthermopolbuffer”(newenglandbiolabs)或類似的。
在一些實(shí)施方案中,(b)的步驟包括在37℃的溫度(例如,在含有2mm鎂的緩沖液中)孵育樣品0.5至3.0小時(shí)。
在一些實(shí)施方案中,在產(chǎn)生雙鏈條形碼化記錄物之后再生多個(gè)核酸條形碼化探針。
在一些實(shí)施方案中,方法還包括從樣品收集條形碼化記錄物。
在一些實(shí)施方案中,所述方法還包括純化從樣品收集的條形碼化記錄物。
在一些實(shí)施方案中,所述方法還包括對(duì)從樣品收集的條形碼化記錄物進(jìn)行測序,從而產(chǎn)生測序數(shù)據(jù)。
在一些實(shí)施方案中,所述方法還包括從測序數(shù)據(jù)重建分子靶相互作用的圖像。
在一些實(shí)施方案中,所述方法還包括將條形碼化記錄物附接到序列特異性銜接子。
在一些實(shí)施方案中,將條形碼化記錄物附接到序列特異性銜接子包括(i)將雙鏈條形碼化記錄物解離為單鏈條形碼化記錄物;(ii)使每條單鏈條形碼化記錄物自退火以形成發(fā)夾結(jié)構(gòu);和(iii)將每個(gè)發(fā)夾結(jié)構(gòu)連接到銜接子序列,從而形成銜接子-條形碼化記錄物。
在一些實(shí)施方案中,所述方法還包括通過聚合酶鏈反應(yīng)(pcr)擴(kuò)增銜接子-條形碼化記錄物,由此產(chǎn)生銜接子-條形碼化記錄物的拷貝。
在一些實(shí)施方案中,所述方法還包括純化銜接子條形碼化記錄物的拷貝,從而產(chǎn)生銜接子條形碼化記錄物的純化拷貝。
在一些實(shí)施方案中,所述方法還包括對(duì)銜接子條形碼化記錄物的純化拷貝進(jìn)行測序,從而確定條形碼化記錄物的序列。
在一些實(shí)施方案中,所述方法還包括計(jì)算處理?xiàng)l形碼化記錄物的序列以產(chǎn)生分子靶相互作用的代表性網(wǎng)絡(luò)。在本公開內(nèi)容的上下文中的“計(jì)算處理”是指使用計(jì)算機(jī)和模型來處理核酸序列(例如,條形碼化記錄物的序列)的過程,例如被理解并表示為算法或協(xié)議。
在一些實(shí)施方案中,引物包括第一核酸鏈,其包含與單鏈引物結(jié)合區(qū)互補(bǔ)的第一序列和第二序列;以及第二核酸鏈,其包含與單鏈引物結(jié)合區(qū)互補(bǔ)的第三序列和與第二序列互補(bǔ)并與其結(jié)合的第四序列,其中所述第一和第二核酸鏈被布置成由單鏈引物區(qū)側(cè)接的雙鏈區(qū)。
在一些實(shí)施方案中,雙鏈區(qū)包含條形碼序列。
在一些實(shí)施方案中,引物還包含至少一個(gè)測序位點(diǎn)或附接位點(diǎn)。
在一些實(shí)施方案中,樣品是生物樣品。例如,生物樣品可以是細(xì)胞或細(xì)胞裂解物。
本公開內(nèi)容的一些方面提供了核酸條形碼化探針對(duì),其包括:(a)被布置成(i)雙鏈條形碼區(qū)和(ii)單鏈引物結(jié)合區(qū)的第一核酸條形碼化探針,和(b)第二單鏈條形碼化探針,其包含條形碼區(qū)和與單鏈引物結(jié)合區(qū)互補(bǔ)的引物區(qū)。
在一些實(shí)施方案中,第一核酸條形碼化探針的雙鏈條形碼區(qū)具有5至50個(gè)核苷酸堿基對(duì)的長度。
在一些實(shí)施方案中,第一核酸條形碼化探針的單鏈引物結(jié)合區(qū)具有4至50個(gè)核苷酸的長度。
在一些實(shí)施方案中,第二核酸條形碼化探針的條形碼區(qū)具有5至50個(gè)核苷酸的長度。
在一些實(shí)施方案中,第二核酸條形碼化探針的引物區(qū)具有4至50個(gè)核苷酸的長度。
在一些實(shí)施方案中,第一核酸條形碼化探針進(jìn)一步包含與雙鏈條形碼區(qū)鄰近的終止聚合的分子或修飾。例如,第一核酸條形碼化探針還可以包含與雙鏈條形碼區(qū)鄰近的終止聚合的合成非dna連接子。
在一些實(shí)施方案中,第一核酸條形碼化探針包含與終止聚合的分子或修飾鄰近的雙鏈置換區(qū)。
在一些實(shí)施方案中,雙鏈置換區(qū)具有2至10個(gè)核苷酸堿基對(duì)的長度。
在一些實(shí)施方案中,第一核酸條形碼化探針被布置成形成包含單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)。在一些實(shí)施方案中,單鏈環(huán)區(qū)具有3至50個(gè)核苷酸的長度。在一些實(shí)施方案中,單鏈環(huán)區(qū)含有(ii)的單鏈引物結(jié)合區(qū)。
在一些實(shí)施方案中,第一核酸條形碼化探針和/或第二核酸條形碼化探針進(jìn)一步包含靶結(jié)合部分。在一些實(shí)施方案中,靶結(jié)合部分位于遠(yuǎn)離第一核酸條形碼化探針的單鏈引物結(jié)合區(qū)的末端和/或位于遠(yuǎn)離第二核酸條形碼化探針的引物區(qū)的末端。在一些實(shí)施方案中,靶結(jié)合部分選自:生物素,抗體,適體,納米體和核酸。
在一些實(shí)施方案中,第一核酸條形碼化探針和第二核酸條形碼化探針各自通過靶結(jié)合部分與分子靶結(jié)合。
本公開內(nèi)容的一些方面提供了包括如本文提供的核酸條形碼化探針對(duì)和布置成雙鏈條形碼區(qū)和單鏈引物結(jié)合區(qū)的第三核酸條形碼化探針的組合物,其中單鏈引物結(jié)合區(qū)與第二核酸條形碼化探針的引物區(qū)互補(bǔ)并結(jié)合。
在一些實(shí)施方案中,第三核酸條形碼化探針還包含靶結(jié)合部分。在一些實(shí)施方案中,第三核酸條形碼化探針通過與結(jié)合分子靶的靶結(jié)合部分結(jié)合到分子靶。
本公開內(nèi)容的一些方面提供了包括如本文提供的核酸條形碼化探針對(duì)和鏈置換聚合酶的組合物。
在一些實(shí)施方案中,鏈置換聚合酶選自:bst大片段聚合酶,phi29聚合酶,deepventr聚合酶,klenow片段聚合酶和修飾的taq聚合酶。。
本公開內(nèi)容的一些方面提供檢測分子靶相互作用的方法,其包括以下步驟:(a)在單一反應(yīng)中組合本文提供的核酸條形碼化探針對(duì)和鏈置換聚合酶,和(b)在導(dǎo)致生產(chǎn)單鏈條形碼化記錄物的條件下孵育反應(yīng)。
本公開內(nèi)容的一些方面提供了檢測分子靶相互作用的方法,其包括以下步驟:(a)兩個(gè)單鏈核酸條形碼化探針,其各自包含回文序列、條形碼序列和引物結(jié)合序列,其中條形碼序列彼此不同,并且其中每個(gè)條形碼化探針附接到分子靶,(b)部分雙鏈引物,其被布置成由各自含有引物與引物結(jié)合序列互補(bǔ)的3'單鏈側(cè)翼區(qū)側(cè)接的雙鏈區(qū),其中雙鏈區(qū)含有可逆共價(jià)結(jié)合位點(diǎn);以及鏈置換聚合酶;在足以允許引物與引物結(jié)合位點(diǎn)結(jié)合和引物的每個(gè)3'側(cè)翼區(qū)的延伸的條件下孵育(a)和(b);和將反應(yīng)加熱到至少50℃的溫度以允許引物從所述兩個(gè)單鏈核酸條形碼化探針解離,從而再生(a)和(b)。
附圖說明
附圖并不是按比例繪制的。為了清楚起見,并非每個(gè)圖中的每個(gè)組件都可被標(biāo)注。
圖1顯示了顯微鏡成像和本公開內(nèi)容的無顯微鏡成像的實(shí)例的示意性比較。
圖2a顯示了分子靶的dna條形碼化和相對(duì)于彼此的靶鄰近度的后續(xù)dna記錄的簡化概述。圖2b,圖(1)-(7)顯示了指示分子靶鄰近度和幾何形狀的dna記錄的示意圖。圖2c顯示了本公開內(nèi)容的無顯微鏡成像方法的一個(gè)實(shí)例的簡要概述。
圖3a顯示了將編碼發(fā)夾的dna模板結(jié)構(gòu)域t的實(shí)例自動(dòng)循環(huán)和釋放到引物鏈a的多個(gè)拷貝上(產(chǎn)生序列a*-t*)的示意圖。圖3b顯示了初始引物結(jié)合(i)、延伸(ii)和鏈置換分支的隨機(jī)行走(iii)的示例機(jī)制,其中針對(duì)每個(gè)模板核苷酸顯示以計(jì)算預(yù)測的相對(duì)締合概率。結(jié)構(gòu)域長度可以是例如6-20個(gè)核苷酸(a),5個(gè)核苷酸(b),0-30個(gè)核苷酸(t)和5個(gè)核苷酸(x)?;パa(bǔ)結(jié)構(gòu)域用虛線表示。圖3c顯示了本公開內(nèi)容的“自動(dòng)循環(huán)”無顯微鏡成像方法(也稱為“自動(dòng)循環(huán)鄰近記錄”或“apr”)的實(shí)例的示意圖。在該實(shí)例中,apr拷貝應(yīng)用引物交換發(fā)夾對(duì)作為探針,其中個(gè)體延伸以結(jié)合半記錄物(i),鏈置換和3'回文結(jié)構(gòu)域雜交(ii),以及半記錄物延伸至完整記錄物(iii)。圖3d顯示指示具有彼此不同長度和不同鄰近度的條形碼的dna記錄物。完整記錄物的產(chǎn)生需要探針的共定位,例如通過與鏈霉親和素結(jié)合的生物素化發(fā)夾環(huán),而分離的探針產(chǎn)生半記錄物。顯示了截取的變性page凝膠,其描繪了具有生物素-鏈霉親和素締合的10μl反應(yīng)(37℃下40分鐘),4:1的總體探針:鏈霉親和素化學(xué)計(jì)量(插圖),8和22nt的條形碼(復(fù)制的19和33nt的莖長度),10:1的引物:探針和40nm總探針濃度。使用單引物序列,不進(jìn)行二次擴(kuò)增。凝膠定量顯示每個(gè)條形碼約5倍至10倍的引物周轉(zhuǎn)量。圖3e顯示了通過定量截取的變性page凝膠上的cy5標(biāo)記的探針來證明自動(dòng)循環(huán)的數(shù)據(jù)。反應(yīng)和凝膠條件與圖1相同,除了使用10個(gè)核苷酸的間隔子(復(fù)制21個(gè)核苷酸莖長)和5:1的引物:探針比以外,探針仍然總濃度為40nm。圖3f顯示了使用圖3a的探針和方法產(chǎn)生的不同dna記錄物的測序數(shù)據(jù)。
圖4a-4c顯示了用于制造可以根據(jù)本公開內(nèi)容使用的“對(duì)稱”自動(dòng)循環(huán)探針的方法的實(shí)例。圖4a顯示化學(xué)合成的探針前體的實(shí)例(a6=aaaaaa;u=脫氧尿苷;a16=u/cat/u/cccagc/u/tac/u(seqidno:7);ax5=ctcac;h22=a、c和/或t的隨機(jī)22-核苷酸組合;t=胸苷;ds6=cgctgg;間隔子9=(integrateddnatechnologies)“isp9”;p6=accggt;探針前體序列:aaaaaa/u/cat/u/cccagc/u/tac/u/ctcachhhhhhhhhhhhhhhhhhhhhhaccggttcgctggtt/ibiodt/ttccagcg/isp9/accggt(seqidno:6))。圖4b顯示了圖4a的探針前體通過聚合酶(bci20=條形碼序列)延伸。圖4c顯示了圖4b的延伸的探針前體的5'末端被'user'酶切割(newenglandbiolabs)。
圖5a顯示了圖4c所示探針的附加細(xì)節(jié)。包括全探針前體序列(seqidno:6)。圖5b顯示了具有5'末端附接物(接頭)的截頭探針的示例,兩個(gè)特征將鄰近度的最大距離減小到6nm。
圖6a-6d顯示了本公開內(nèi)容的dna記錄物的制備方法的實(shí)例。探針與靶結(jié)合,加入可溶性記錄引物(圖6a)。引物結(jié)合并通過置換聚合酶復(fù)制條形碼(圖6b)。兩個(gè)延伸記錄物自動(dòng)從探針中移位,并在回文3'末端雜交(圖6c)。相同的聚合酶通過第二條碼延伸記錄物,并從探針中移除記錄物(圖6d)。示例反應(yīng)條件:緩沖液-水中的1xbst緩沖液;聚合酶-bst,具有替代phi29或其他置換聚合酶;溫度-37℃;時(shí)間-0.5至3小時(shí)或更長時(shí)間。
圖7a-7c顯示了本公開內(nèi)容的dna記錄物的處理方法的一個(gè)例子。將記錄物收集在上清液中(圖7a)并附接到測序特異性“銜接子”(圖7b)。然后,完成幾輪pcr(圖7c)?;蛘撸梢允褂酶鞣N標(biāo)準(zhǔn)方法在銜接子添加之前復(fù)制記錄物,最終導(dǎo)致每個(gè)原始記錄物的多個(gè)拷貝,每個(gè)具有銜接子序列。
圖8a-8b顯示了讀取dna記錄物和重建過程的方法的示例。記錄物被凝膠或柱純化和測序(例如,通過下一代測序)(圖8a)。然后計(jì)算處理結(jié)果進(jìn)行網(wǎng)絡(luò)提取(圖8b)。
圖9a-9g顯示本公開內(nèi)容的對(duì)稱自動(dòng)循環(huán)探針的其它實(shí)例。圖9a顯示了具有簡單的“遠(yuǎn)端環(huán)”區(qū)的自動(dòng)循環(huán)探針的示例。圖9b顯示具有鎖核酸(lna)的自動(dòng)循環(huán)探針的實(shí)例。圖9c顯示了具有共價(jià)鍵或其它接頭而不是莖或環(huán)的自動(dòng)循環(huán)探針的實(shí)例。圖9d顯示了具有由凸起、弱匹配或錯(cuò)配削弱的引物的自動(dòng)循環(huán)探針的實(shí)例。圖9e顯示了具有更強(qiáng)的回文或其他“p”序列的自動(dòng)循環(huán)探針的實(shí)例。圖9f顯示了具有包括探針的任一端、記錄物本身或作為第三鏈(示出)的動(dòng)態(tài)“輔助”解離鏈的自動(dòng)循環(huán)探針的實(shí)例。圖9g顯示了具有兩個(gè)競爭者的自動(dòng)循環(huán)雙端或環(huán)狀探針的示例。
圖10a顯示了“非對(duì)稱”自動(dòng)循環(huán)探針的示例。兩個(gè)探針相互作用,將條形碼區(qū)從左側(cè)的發(fā)夾狀探針(bcj12)復(fù)制到右側(cè)的線性探針上。本文提供了各種探針結(jié)構(gòu)(圖10b-10e)。該探針組也是自動(dòng)循環(huán)的,反復(fù)連接條形碼到右側(cè)探針的3'端。
圖11顯示了本公開內(nèi)容的溫度依賴性循環(huán)機(jī)制的實(shí)例,其中記錄物如前所述被復(fù)制,但是在溫度暫時(shí)升高時(shí)從探針對(duì)釋放而不是從互補(bǔ)探針序列置換。如在(非溫度依賴性)自動(dòng)循環(huán)系統(tǒng)中的,可以重復(fù)該循環(huán)以從相同的探針創(chuàng)建更多記錄物。
圖12顯示了本公開內(nèi)容的引物的另一個(gè)實(shí)例。
圖13a和圖13a顯示本公開內(nèi)容的連接和擴(kuò)增方法的實(shí)例。記錄物可以用限制性內(nèi)切酶切割,然后通過“粘性”末端連接(圖13a)??梢杂靡环N或多種內(nèi)切核酸酶切割過量未連接的記錄物材料(圖13b)
圖14顯示了本公開內(nèi)容的記錄物釋放機(jī)制的示例。
圖15顯示本公開內(nèi)容的無顯微鏡成像方法的實(shí)例應(yīng)用于異質(zhì)egfr膜蛋白簇,其可以在用藥物治療時(shí)重新配置。每個(gè)個(gè)體蛋白質(zhì)(而不是蛋白質(zhì)種類)可以用獨(dú)特的條形碼標(biāo)記。
圖16a-16c顯示本公開內(nèi)容的無顯微鏡成像方法用于核體組織的示例應(yīng)用。灰色筆畫表示染色體相互作用(圖16a)。圖16b顯示以低分辨率(點(diǎn))取樣的染色體拷貝沒有區(qū)別,并且相互作用的重構(gòu)很差。圖16c顯示,在高分辨率(點(diǎn))處,臨界相互作用和染色體復(fù)制使用無顯微鏡成像是顯而易見的。dna和rna或蛋白質(zhì)之間的相互作用也可通過此分辨率下的無顯微鏡成像進(jìn)行(未顯示)。
圖17顯示了本公開內(nèi)容的更遠(yuǎn)程無顯微鏡成像的示例。
圖18顯示了用于基于測序的靶蛋白計(jì)數(shù)的無顯微鏡成像方法的示例。可以從閱讀生成的dna報(bào)告物鏈/記錄物的序列來解碼各種信息,包括例如蛋白質(zhì)類型,數(shù)字計(jì)數(shù)和樣品來源。當(dāng)兩個(gè)探針靶向相同蛋白質(zhì)時(shí)創(chuàng)建的唯一記錄物條形碼的數(shù)量表示系統(tǒng)中的蛋白質(zhì)數(shù)量。該方案還利用記錄引物(recordprimer)本身上的隨機(jī)“獨(dú)特的分子標(biāo)識(shí)符”條形碼,使得探針之間的機(jī)會(huì)相互作用(不是由靶蛋白上的共定位引起)可以在后處理中由于在該配對(duì)中生成的低(例如,單個(gè))記錄物數(shù)而被忽略。
圖19a-19c顯示了探針距離和幾何結(jié)構(gòu)。為了精確控制相對(duì)探針定位,將探針附接到測量為70×100nm的2d、矩形、扭曲校正的dna納米結(jié)構(gòu)(圖19a)。在完全組裝之后,在12.5mmmg2+存在下將納米結(jié)構(gòu)隨機(jī)沉積在云母表面上,用于牢固的粘附,這是保護(hù)納米結(jié)構(gòu)免受聚合酶降解的條件。每個(gè)探針通過直接延伸兩個(gè)短核酸(顯示在納米結(jié)構(gòu)的小截面上)或共價(jià)附接到中間寡核苷酸(插圖;在通過基于dibo的點(diǎn)擊化學(xué)共價(jià)連接在ttt-l中間體上并凝膠純化的探針環(huán)上的疊氮化物)。在納米結(jié)構(gòu)附接點(diǎn)測量探針的分離。所產(chǎn)生的記錄物可用例如a1*和a2*引物進(jìn)行pcr擴(kuò)增。否則,將間隔子長度為0或12(通過縫釘延伸連接)或18nt(共價(jià)連接)的相同探針以6至48nm×6nm增量的間隔保持成對(duì),記錄(室溫下1小時(shí),每孔約50萬個(gè)納米結(jié)構(gòu),100nm引物)和對(duì)數(shù)期pcr擴(kuò)增(20個(gè)循環(huán),500nm引物)至凝膠可檢測水平(圖19b)。對(duì)每個(gè)孔將變性page帶定量標(biāo)準(zhǔn)化至恒定參考對(duì)。然后將給定探針對(duì)類型的整個(gè)系列通過最小二乘法遞歸擬合到s形曲線c1/(1+exp[c2(dist-c3)]),其中dist表示間隔距離,并歸一化至1的最大速率。采用相同的納米結(jié)構(gòu)基礎(chǔ)矩形,以四個(gè)布置(簡圖)以30nm的間隔保持三個(gè)探針(18nt間隔子設(shè)計(jì)的p1,p2,p3,)(圖19c)。當(dāng)三角形布置時(shí),所有三個(gè)探針對(duì)產(chǎn)生記錄物,但在線性布置中,只有鄰近的探針對(duì)產(chǎn)生記錄物。類似于圖19b,通過變性page定量對(duì)數(shù)期pcr。
圖20a-20b表示表征狀態(tài)變化的數(shù)據(jù)。使用與圖19c中圖(i)相同的納米結(jié)構(gòu)探針三角形,除了探針p3可以被失活之外(圖20a)。圖20b顯示了來自活性探針的記錄物的pcr擴(kuò)增和變性page凝膠,中間洗滌后,并從無活性探針進(jìn)行記錄。中間洗滌結(jié)果確保沒有剩余的記錄物。所有步驟均采用單組納米結(jié)構(gòu),并進(jìn)行重新采樣。
發(fā)明詳述
生物體是復(fù)雜的分子系統(tǒng)。成像提供了一種自然而直接的方式來研究這種系統(tǒng),并已成為生物學(xué)研究的核心方法。研究這種系統(tǒng)的理想方法是以單分子分辨率同時(shí)顯現(xiàn)其天然狀態(tài)下的所有相關(guān)分子??梢暬锵到y(tǒng)的一種方法是通過顯微鏡,盡管使用顯微鏡來成像分子世界帶來了幾個(gè)挑戰(zhàn),包括“視力模糊”,部分“色盲”,有限的通量和限制的樣品獲取。在動(dòng)態(tài)地重新配置的擁擠的分子群體中,難以清晰地看到單個(gè)分子,導(dǎo)致“視力模糊”。可以僅使用少量不同的顏色(例如3或4)來同時(shí)跟蹤多個(gè)不同的分子,這導(dǎo)致部分“色盲”;顯微鏡具有有限的視野,允許在所選擇的區(qū)僅觀察到小群體的選定分子,從而限制通量;難以清楚地以其天然生存形態(tài)可視化分子,特別是因?yàn)榉肿?例如,作為生物樣品的組分)經(jīng)常被從其生物背景中取出并被加工以適合于顯微鏡的特定觀察平臺(tái)(例如,在薄的固定或冷凍樣品片)。
因此,需要替代顯微鏡來對(duì)復(fù)雜生物系統(tǒng)的分子相互作用進(jìn)行成像。在本文中,在一些方面,提供了無顯微鏡成像(mfi)方法和相關(guān)組合物,其涉及大量分子靶的“自下而上”分析,其分別與獨(dú)特的核酸條形碼化探針連接,本文稱為“條形碼化靶“(參見例如圖1和圖2a)。例如,當(dāng)條形碼化靶彼此接近時(shí),條形碼化靶的空間配置的核酸記錄物(本文簡稱為“記錄物”)(例如,條形碼化靶相對(duì)于彼此的鄰近度和/或布置)被反復(fù)創(chuàng)建,而不會(huì)破壞條形碼化靶。因此,隨著時(shí)間的推移,隨著條形碼化靶改變其空間配置(例如,與不同的條形碼化靶相互作用),生成這些改變的記錄物。記錄物稍后通過例如高通量核酸測序讀取,并且基礎(chǔ)分子靶的圖像被計(jì)算地重建。如果例如兩個(gè)分子靶保持物理或化學(xué)地相互作用或彼此相關(guān)聯(lián),則它們被認(rèn)為是彼此“鄰近”的。如果兩個(gè)靶之間的距離為0納米(nm)至100納米(或0個(gè)核苷酸(nt)至100nt),則兩個(gè)分子靶也被認(rèn)為彼此“鄰近”。例如,兩個(gè)彼此接近的靶之間的距離可以是0nm至5nm,0nm至10nm,0nm至20nm,0nm至30nm,0nm至40nm或0nm至50nm。
本發(fā)明的方法和組合物在一些實(shí)施方案中提供了以高空間分辨率以大規(guī)模平行方式原位成像單分子靶(或可選地,單個(gè)種類的分子靶)的動(dòng)態(tài)過程的平臺(tái)(其具有復(fù)用能力),實(shí)現(xiàn)高通量分子成像。有利地,如本文所提供的無顯微鏡成像避免了苛刻和破壞性的樣品處理,同時(shí)允許超高分辨率,分子結(jié)構(gòu)的圖像的精確的計(jì)算生成,數(shù)字分子計(jì)算,相互作用化學(xué)計(jì)量和狀態(tài)分布的分析以及從個(gè)體分子網(wǎng)絡(luò)獲得的真實(shí)的連通性和動(dòng)力學(xué)數(shù)據(jù)。
本文提供的方法使用核酸(例如dna,例如隨機(jī)dna)“條形碼”來獨(dú)特地標(biāo)記每個(gè)感興趣的分子靶(圖2a)。當(dāng)兩個(gè)條形碼化靶彼此靠近時(shí),自動(dòng)生成編碼兩個(gè)條形碼的標(biāo)識(shí)的記錄物。對(duì)于分離的條形碼化靶(也就是說,不靠近另一個(gè)條形碼化靶的條形碼化靶),不會(huì)產(chǎn)生任何記錄物(圖2b(1))。對(duì)于一對(duì)接近的條形碼化靶對(duì),生成一對(duì)獨(dú)特的記錄物(圖2b(2)),而對(duì)于三個(gè)接近的條形碼化靶,生成兩個(gè)記錄物,每個(gè)記錄物獨(dú)特于三個(gè)條形碼化靶的一對(duì)(圖2b(3))。同樣,對(duì)于更復(fù)雜的空間配置,產(chǎn)生多個(gè)記錄物,每個(gè)記錄物獨(dú)特于復(fù)雜配置的每一對(duì)(圖2b(5)和2b(6))。以這種方式,可以記錄精確的相互連通性和通過推理,整體幾何結(jié)構(gòu)。此外,對(duì)于動(dòng)態(tài)配置,產(chǎn)生與關(guān)聯(lián)時(shí)間成比例的記錄物,并且在某些情況下可以被時(shí)間標(biāo)記(圖2b(7))。本文提供的無顯微鏡成像方法的示例的概述如圖2c所示。樣品中的每個(gè)分子靶用獨(dú)特的條形碼標(biāo)記,重復(fù)和連續(xù)的分子重構(gòu)(例如,締合/相互作用),自主產(chǎn)生記錄物,并且使用高通量測序讀取記錄物,然后通過動(dòng)態(tài)分子靶重構(gòu)的計(jì)算重建進(jìn)行圖像生成,如本文所用的術(shù)語“重新配置”和“重構(gòu)”是指分子靶位置的變化隨著時(shí)間的推移相對(duì)于彼此的變化。例如,在時(shí)間1,三個(gè)分子靶可以布置成線性構(gòu)型,并且在時(shí)間2,三個(gè)分子靶可以布置成三角形構(gòu)型。因此,相對(duì)于時(shí)間1,三個(gè)分子因此在時(shí)間2“重新配置”。
本公開內(nèi)容的無顯微鏡成像基于“自動(dòng)循環(huán)”反應(yīng)。這種重復(fù)的自動(dòng)循環(huán)(例如,重復(fù)的探針和靶產(chǎn)生)將異常產(chǎn)生的記錄物(例如,在溶液中形成的記錄物)限制至一個(gè)拷貝,這可以容易地丟棄。通常但并非總是在37℃下在置換聚合酶存在下進(jìn)行反應(yīng)。用于鑒定單分子靶的條形碼被摻入核酸探針(本文中稱為“核酸條形碼化探針”或簡稱“條形碼化探針”),其在一些實(shí)施方案中通過靶結(jié)合部分(例如生物素,抗體,適體,納米體或核酸)連接至分子靶。條形碼化探針被設(shè)計(jì)成使得在存在置換聚合酶和通用的可溶性引物的情況下,條形碼化探針引導(dǎo)重復(fù)產(chǎn)生鄰近條形碼化記錄物的自循環(huán)過程。圖3a描繪了本公開內(nèi)容的基礎(chǔ)方法的分子機(jī)制的實(shí)例。在步驟(1)中,可溶性通用u*引物以常見的單鏈引物結(jié)合u區(qū)結(jié)合每個(gè)探針,置換聚合酶將引物延伸穿過條形碼(i或j)區(qū)和回文p區(qū)到終止聚合的分子或修飾(例如,合成的非dna接頭),從而產(chǎn)生“半記錄物”,其是指包含通用u*引物,條形碼(i或j)和條形碼(i或j)的新產(chǎn)生的核酸鏈回文p*序列(例如,u*-i*-p*或u*-j*-p*)。請(qǐng)注意,帶有上標(biāo)“*”的字母表示與沒有“*”的相應(yīng)字母表示的序列互補(bǔ)的序列。在步驟(2)中,半記錄物通過“鏈置換”機(jī)制部分地從條形碼化探針置換(參見例如yurke等人,nature406:605-608,2000;以及zhang等人,naturechemistry3:103-113,2011,每篇文獻(xiàn)通過引用并入本文)和近半記錄物通過3'回文區(qū)p*相互雜交。在步驟(3)中,半記錄物通過條形碼(i和j)區(qū)和引物結(jié)合u區(qū)延伸,釋放編碼條形碼(i和j)探針的可溶性完整記錄物。條形碼化探針被“再生”并且能夠在相同或其它分子靶配對(duì)中經(jīng)歷額外的循環(huán)。循環(huán)反應(yīng)終止后,通過例如大規(guī)模并行的下一代測序技術(shù)收集、制備和測序記錄物。序列數(shù)據(jù)表示空間配置,在某些情況下表示分子靶的連接/相互作用,準(zhǔn)備用于統(tǒng)計(jì)分析和圖像重建。
“鏈置換”是指當(dāng)鄰近單個(gè)互補(bǔ)核酸鏈(或鏈的片段)時(shí)具有相同序列的兩個(gè)核酸鏈對(duì)于該互補(bǔ)鏈進(jìn)行相對(duì)快速(例如,時(shí)間尺度<1s)競爭的機(jī)制,假定通過“隨機(jī)行走”機(jī)制從互補(bǔ)體中相互置換。
條形碼化探針
在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針包含一個(gè)或多個(gè)布置成雙鏈回文區(qū)、雙鏈條形碼區(qū)和引物結(jié)合區(qū)的核酸鏈。在一些實(shí)施方案中,條形碼化探針被布置成形成發(fā)夾結(jié)構(gòu),其是折疊并形成稱為“莖”的雙鏈區(qū)和稱為“環(huán)”的單鏈區(qū)的單鏈連續(xù)核苷酸。當(dāng)相同核酸的兩個(gè)區(qū)的核苷酸彼此堿基配對(duì)時(shí)(分子內(nèi)堿基配對(duì)),形成雙鏈區(qū)。條形碼化核酸發(fā)夾的一個(gè)實(shí)例如圖5所示。
在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針包含兩個(gè)平行的核酸鏈(例如,作為兩個(gè)分開的核酸或作為連續(xù)的折疊的發(fā)夾)。其中一條鏈稱為“互補(bǔ)鏈”,另一條鏈稱為“置換鏈”?;パa(bǔ)鏈通常含有引物結(jié)合區(qū),或至少引物結(jié)合(例如,雜交)的引物結(jié)合區(qū)的單鏈區(qū)段?;パa(bǔ)鏈和置換鏈至少通過雙鏈條形碼區(qū)并通過雙鏈回文區(qū)彼此結(jié)合?!爸脫Q鏈”是最初由如本文所述的新生成的半記錄物置換并且進(jìn)而隨著置換鏈“重新結(jié)合”到互補(bǔ)鏈,置換新產(chǎn)生的半記錄物的鏈。
如果兩個(gè)核酸或兩個(gè)核酸區(qū)通過watson-crick相互作用彼此堿基對(duì)或彼此結(jié)合以形成雙鏈核酸分子,則彼此“互補(bǔ)”(也稱為雜交)。如本文所用,“結(jié)合”是指在生理?xiàng)l件下由于例如靜電,疏水,離子和/或氫鍵相互作用而在至少兩個(gè)分子之間的締合。
核酸的“雙鏈區(qū)”是指含有通過互補(bǔ)的嘌呤(例如腺嘌呤和鳥嘌呤)和嘧啶(例如胸腺嘧啶,胞嘧啶和尿嘧啶)之間的氫鍵彼此結(jié)合從而形成雙螺旋的兩條平行核酸鏈的核酸區(qū)(例如dna或rna)。在一些實(shí)施方案中,形成雙鏈區(qū)的兩條平行核酸鏈?zhǔn)沁B續(xù)核酸鏈的一部分。例如,如上所述,本公開內(nèi)容提供了發(fā)夾結(jié)構(gòu)形式的核酸條形碼化探針(例如,圖5)。
核酸的“單鏈區(qū)”是指含有與第二核酸鏈未結(jié)合(未配對(duì))的單個(gè)核酸鏈的核酸區(qū)。應(yīng)當(dāng)理解,發(fā)夾結(jié)構(gòu)形式的條形碼化探針包含被稱為“莖”的雙鏈區(qū)(配對(duì)區(qū))和被稱為作為“環(huán)”的單鏈區(qū)(未配對(duì)區(qū)),如上所述。
“雙鏈回文區(qū)”是指核酸(例如,dna或rna)條形碼化探針的區(qū),其無論是在一條鏈的5’(5撇)至3’(3撇)還是在其形成雙螺旋的互補(bǔ)鏈上的5'至3'均是相同序列的核苷酸。例如,以下序列,如圖5所示,被認(rèn)為是回文序列:accggt。因此,包含上述序列的雙鏈回文區(qū)如下:
5'-accggt-3’
3'-tggcca-5’;
如圖3a所示,回文(p*)序列允許連接彼此接近的條形碼化探針(和間接地,條形碼化靶)。與引物結(jié)合區(qū)結(jié)合的引物的聚合酶延伸產(chǎn)生“半記錄物”,其是指新產(chǎn)生的核酸鏈。半記錄物的產(chǎn)生將條形碼化探針中的一條鏈置換,被稱為“置換鏈”。該置換鏈進(jìn)而置換半記錄物的一部分(通過結(jié)合其“互補(bǔ)鏈”),從3'末端起始,從而使包含回文序列的半記錄物的3'末端能夠結(jié)合到同樣從鄰近的條形碼化核酸置換的另一個(gè)半記錄物。
在一些實(shí)施方案中,雙鏈回文區(qū)具有4至10個(gè)核苷酸堿基對(duì)的長度。也就是說,在一些實(shí)施方案中,雙鏈回文區(qū)可以包含與4至10個(gè)互補(bǔ)核苷酸結(jié)合的4至10個(gè)連續(xù)核苷酸。例如,雙鏈回文區(qū)可以具有4、5、6、7、8、9或10個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈回文區(qū)可以具有5至6個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈回文區(qū)長于10個(gè)核苷酸堿基對(duì)。例如,雙鏈回文區(qū)可以具有4至50個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈回文區(qū)具有4至40、4至30或4至20個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,可以用與另一探針產(chǎn)生的任意序列互補(bǔ)的任意序列來替代回文區(qū)。在這樣的實(shí)施方案中,探針能夠僅與具有互補(bǔ)的3'末端序列的探針配對(duì)。
雙鏈回文區(qū)可以包括鳥嘌呤(g),胞嘧啶(c),腺嘌呤(a)和/或胸腺嘧啶(t)。在一些實(shí)施方案中,g和c核苷酸堿基對(duì)(g/c)相對(duì)于a和t核苷酸堿基對(duì)(a/t)的百分比大于50%。例如,雙鏈回文區(qū)的g/c相對(duì)于a/t的百分比可以為50至100%。在一些實(shí)施方案中,g/c相對(duì)于a/t的百分比大于60%,65%,70%,75%,80%,85%,90%,95%。
在一些實(shí)施方案中,雙鏈回文區(qū)可以包括偶數(shù)個(gè)核苷酸堿基對(duì),盡管本發(fā)明的雙鏈回文區(qū)不受此限制。例如,雙鏈回文區(qū)可以包括4、6、8或10個(gè)核苷酸堿基對(duì)?;蛘?,雙鏈回文區(qū)可以包括5、7或9個(gè)核苷酸堿基對(duì)。
在多個(gè)核酸條形碼化探針中,典型地,雙鏈回文區(qū)對(duì)于多個(gè)核酸條形碼化探針的每個(gè)探針是相同的,使得彼此接近的任何兩個(gè)探針能夠通過生成的包含回文序列的半記錄物彼此結(jié)合。然而,在一些實(shí)施方案中,雙鏈回文區(qū)可以僅在多個(gè)核酸條形碼化探針的條形碼化探針的子集中相同,使得兩個(gè)不同的子集包含兩種不同的雙鏈回文區(qū)。
“雙鏈條形碼區(qū)”是指將探針識(shí)別為屬于特定分子靶或分子靶種類的核酸(例如dna或rna)條形碼化探針的雙鏈區(qū)。雙鏈條形碼區(qū)可以以隨機(jī)或合理設(shè)計(jì)的順序包含核苷酸的任何組合。在一些實(shí)施方案中,雙鏈條形碼區(qū)具有2至100個(gè)核苷酸堿基對(duì)的長度。也就是說,在一些實(shí)施方案中,雙鏈條形碼區(qū)可以包含與分別2至100個(gè)互補(bǔ)的核苷酸結(jié)合的2至100個(gè)連續(xù)核苷酸。例如,雙鏈條形碼區(qū)的長度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)核苷酸堿基對(duì)。在一些實(shí)施方案中,雙鏈條形碼區(qū)可以具有2至5、2至10、2至15、2至20、2至25、2至30、2至35、2至40、2至45,或2至50個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈條形碼區(qū)可以具有35至50、35至60、35至70、35至80、35至90或35至100個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈條形碼區(qū)長于100個(gè)核苷酸堿基對(duì)。例如,雙鏈條形碼區(qū)可以具有2至200個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈條形碼區(qū)的長度為2至190、2至180、2至170、2至160、2至150、2至140、2至130、2至120或2至110核苷酸堿基對(duì)。
如果探針的條形碼區(qū)僅與分子靶相關(guān)聯(lián)并且可以用于僅識(shí)別分子群體(包含具有自己獨(dú)特的條形碼化探針的其他分子靶分子靶)中的該分子靶,則核酸條形碼化探針被認(rèn)為對(duì)于該分子靶是“獨(dú)特”或“特異性”的。類似地,如果探針的條形碼區(qū)僅與分子靶種類相關(guān)聯(lián)并且可以僅用于鑒定分子群體中的該分子靶種類,則核酸條形碼化探針被認(rèn)為針對(duì)該分子靶種類是“獨(dú)特”或“特異性”的。
“引物結(jié)合區(qū)”是指其中單鏈引物(例如dna或rna引物)結(jié)合以起始復(fù)制的核酸(例如dna或rna)條形碼化探針的區(qū)。引物結(jié)合區(qū)可以是單鏈區(qū)或部分雙鏈區(qū),其是指包含單鏈區(qū)段和雙鏈區(qū)段的區(qū)。部分雙鏈引物結(jié)合區(qū)的實(shí)例如圖5所示,其中“a16”表示引物結(jié)合區(qū)的單鏈區(qū),“ax5”表示引物結(jié)合區(qū)的雙鏈區(qū)。引物結(jié)合區(qū)可以以隨機(jī)或合理設(shè)計(jì)的順序包含核苷酸的任何組合。在一些實(shí)施方案中,取決于引物結(jié)合區(qū)的單鏈和/或雙鏈性質(zhì),引物結(jié)合區(qū)具有4至40個(gè)核苷酸的長度(或核苷酸堿基對(duì),或核苷酸和核苷酸堿基對(duì)的組合))。例如,引物結(jié)合區(qū)可以具有4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個(gè)核苷酸(和/或核苷酸堿基對(duì))的長度。在一些實(shí)施方案中,引物結(jié)合區(qū)可以具有4至10、4至15、4至20、4至25、4至30、4至35或4至40個(gè)核苷酸(和/或核苷酸堿基對(duì))的長度。在一些實(shí)施方案中,引物結(jié)合區(qū)長于40個(gè)核苷酸。例如,引物結(jié)合區(qū)可以具有4至100個(gè)核苷酸的長度。在一些實(shí)施方案中,引物結(jié)合區(qū)具有4至90、4至80、4至70、4至60或4至50個(gè)核苷酸的長度。
在一些實(shí)施方案中,引物結(jié)合區(qū)被設(shè)計(jì)為適應(yīng)多于一種(例如2或3種不同的)引物的結(jié)合。
再次參照?qǐng)D3a和5,作為實(shí)例,通過置換聚合酶的引物(與引物結(jié)合位點(diǎn)結(jié)合)的延伸通常通過終止聚合的分子或修飾的存在來終止。因此,在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針包含終止聚合的分子或修飾。終止聚合的分子或修飾(“終止物”或“阻斷物”)通常位于與雙鏈回文區(qū)鄰近的條形碼化探針的雙鏈區(qū),使得聚合終止引物通過雙鏈回文區(qū)的延伸。對(duì)于以發(fā)夾形式布置的核酸條形碼化探針,終止聚合的分子或修飾可以位于雙鏈回文區(qū)和發(fā)夾環(huán)之間,如圖5所示(“間隔子9”)。在一些實(shí)施方案中,終止聚合的分子是合成的非dna接頭,例如三乙二醇間隔子,例如intspacer9(isp9)或spacer18(integrateddnatechnologies(idt))。應(yīng)當(dāng)理解,可以如本文提供的那樣使用終止聚合酶聚合的任何非天然接頭。這種分子和修飾的其它非限制性實(shí)例包括三碳鍵(/ispc3/)(idt),acryditetm(idt),腺苷酸化,疊氮化物,地高辛(nhs酯),膽固醇-teg(idt),i-linkertm(idt)和3-氰基乙烯基咔唑(cnvk)及其變型。通常,但不總是,短接頭(例如,isp9)導(dǎo)致更快的反應(yīng)時(shí)間。
在一些實(shí)施方案中,終止聚合的分子是分別是胞嘧啶和鳥嘌呤的化學(xué)變體的單個(gè)或成對(duì)的非天然核苷酸序列,例如iso-dg和iso-dc(idt)。iso-dc將與iso-dg堿基配對(duì)(氫鍵),但不與dg結(jié)合。類似地,iso-dg將與iso-dc堿基配對(duì)但不與dc堿基配對(duì)。通過在發(fā)夾的相對(duì)側(cè)上成對(duì)并入這些核苷酸,在終止位置,聚合酶將被停止,因?yàn)樵谌芤褐袥]有互補(bǔ)核苷酸以在該位置添加。
在一些實(shí)施方案中,通過將反應(yīng)中的dntp濃度(例如,200μm)降低至100μm,10μm,1μm或更小來提高“終止”或“阻斷”修飾的性能的效率。
包含終止聚合的分子或修飾通常在條形碼化探針的雙鏈區(qū)(例如,發(fā)夾結(jié)構(gòu)的莖區(qū))中產(chǎn)生“凸起”,因?yàn)榉肿踊蛐揎椢锊慌鋵?duì)(參見例如圖5)。因此,在一些實(shí)施方案中,與分子或修飾相對(duì)地,條形碼化探針被設(shè)計(jì)為包括單個(gè)核苷酸(例如胸腺嘧啶),至少兩個(gè)相同核苷酸(例如,胸腺嘧啶二聚體(tt)或三聚體(ttt)),或非自然修飾。
因此,為了防止聚合酶延伸條形碼化探針的末端(例如,5'或3'末端),使用多聚t序列(例如,序列2、3、4、5、7、8、9或10個(gè)胸腺嘧啶核苷酸的序列),如圖5所示?;蛘?,可以將合成堿基(例如反向dt)或其它修飾物加入到條形碼化探針的末端(例如5'或3'末端),以防止探針的不期望的聚合。其他終止分子(阻止不期望延伸的3'末端的延伸的分子)包括但不限于iso-dg和iso-dc或其他非天然核苷酸或修飾。
如上所述,半記錄物的產(chǎn)生(參見例如圖3a)置換條形碼化探針中的一條鏈。這個(gè)置換的鏈進(jìn)而從3'端開始置換半記錄物的一部分。在一些實(shí)施方案中,通過與終止聚合的分子或修飾鄰近的“雙鏈置換區(qū)”,半記錄物的這種置換被促進(jìn)(參見例如圖5,“ds6”)。在其中條形碼化探針具有發(fā)夾結(jié)構(gòu)的實(shí)施方案中,雙鏈置換區(qū)可以位于終止聚合的分子或修飾和發(fā)夾環(huán)之間(參見例如圖5)。雙鏈置換區(qū)可以以隨機(jī)或合理設(shè)計(jì)的順序包含核苷酸的任何組合。在一些實(shí)施方案中,雙鏈置換區(qū)具有2至10個(gè)核苷酸堿基對(duì)的長度。例如,雙鏈置換區(qū)可以具有2、3、4、5、6、7、8、9或10個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈回文區(qū)可以具有5至6個(gè)核苷酸堿基對(duì)的長度。在一些實(shí)施方案中,雙鏈回文區(qū)可以僅含有c和g核苷酸的組合。
在一些實(shí)施方案中,也可以通過修改反應(yīng)條件來促進(jìn)半記錄物的置換。例如,一些自循環(huán)反應(yīng)可以包括用于新鏈產(chǎn)生的硫代磷酸酯核苷酸(2'-脫氧核苷α-硫醇2'-脫氧核苷α-硫醇三磷酸酯集,trilinkbiotechnologies)來替代天然的可溶性dntp。這些在天然dntp的雜交中不太穩(wěn)定,并導(dǎo)致半記錄物和莖之間的相互作用減弱。它們可以以任何組合使用(例如,硫代磷酸酯a與天然t,c和g堿基,或混合物的其它組合或比例)??梢赃M(jìn)行其它這樣的化學(xué)修飾以減弱半記錄物配對(duì)并促進(jìn)置換。
類似地,在一些實(shí)施方案中,探針本身可以被修飾,其中非天然核苷酸代替加強(qiáng)發(fā)夾莖。在這樣的實(shí)施方案中,產(chǎn)生半記錄物的置換聚合酶仍可以打開并復(fù)制莖,但是在鏈置換過程中,在與莖模板的半記錄物雜交方面在能量上有利于莖序列的重新雜交。非天然核苷酸的非限制性實(shí)例包括5-甲基dc(5-甲基脫氧胞苷;當(dāng)代替dc時(shí),該分子將核酸的解鏈溫度每個(gè)核苷酸插入增加多達(dá)5℃),2,6-二氨基嘌呤(該分子可以使每個(gè)插入的解鏈溫度提高多達(dá)1-2℃),supert(5-羥基丁炔-2'-脫氧尿苷也可以增加核酸的解鏈溫度)和/或鎖核酸(lna)。它們可能發(fā)生在發(fā)夾莖的任一條或兩條鏈中。
在一些實(shí)施方案中,可以使用非天然核苷酸引入新的半記錄物序列和莖之間的錯(cuò)配。例如,如果isog核苷酸存在于莖的模板鏈中,則聚合酶在某些情況下會(huì)錯(cuò)誤地添加可用的可溶性核苷酸之一來延長半記錄物,并且這樣做會(huì)在新的半記錄物和莖模板鏈之間產(chǎn)生“凸起”,非常類似于圖5a的凸起(包括在引物中)。同樣的目的是削弱半記錄物-模板相互作用和鼓勵(lì)置換。
在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針被設(shè)置成形成發(fā)夾結(jié)構(gòu),其是折疊并形成雙鏈區(qū)(稱為“莖”)和單鏈區(qū)(被稱為“環(huán)”)的單鏈連續(xù)核苷酸。在一些實(shí)施方案中,單鏈環(huán)區(qū)具有3至50個(gè)核苷酸的長度。例如,單鏈環(huán)區(qū)可以具有3個(gè),4個(gè),5個(gè),6個(gè),7個(gè),8個(gè),9個(gè)或10個(gè)核苷酸的長度。在一些實(shí)施方案中,單鏈環(huán)區(qū)具有3至10、3至15、3至20、3至25、3至30、3至35、3至40、3至45或3至50個(gè)核苷酸的長度。在一些實(shí)施方案中,單鏈環(huán)區(qū)長于50個(gè)核苷酸。例如,單鏈環(huán)區(qū)可以具有3至200個(gè)核苷酸的長度。在一些實(shí)施方案中,單鏈環(huán)區(qū)具有3至175、3至150、3至100或3至75個(gè)核苷酸的長度。在一些實(shí)施方案中,環(huán)區(qū)包括較小的分子內(nèi)堿基配對(duì)區(qū)。發(fā)夾環(huán)在一些實(shí)施方案中允許條形碼化探針相對(duì)于靶結(jié)合部分的取向具有柔性。也就是說,環(huán)通常允許條形碼化探針相對(duì)于靶結(jié)合部分占據(jù)各種位置和角度,從而允許相繼地與多個(gè)附近的探針(例如,附接到其它靶)相互作用。
本公開內(nèi)容的核酸條形碼化探針通常通過靶結(jié)合部分附接到分子靶。在一些實(shí)施方案中,靶結(jié)合部分附接到條形碼化探針的末端(例如,遠(yuǎn)離引物結(jié)合區(qū)的末端)。在一些實(shí)施方案中,靶結(jié)合部分附接到以發(fā)夾形式布置的條形碼化探針的單鏈環(huán)區(qū)(參見例如圖5)。
用于本文提供的靶結(jié)合部分的實(shí)例包括但不限于生物素,抗體,適體,納米體,核酸,藥物(例如小分子藥物)和原子(例如li)??紤]了其他靶向分子。在一些實(shí)施方案中,分子靶可以通過雜交或“點(diǎn)擊化學(xué)”附接到條形碼化探針。參見例如kolbh.c.,等人.angewandtechemieinternationaledition2001,40(11):2004–2021;andevansr.a.australianjournalofchemistry,2007,60(6):384–395。
在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針包含至少一個(gè)鎖核酸(lna)核苷酸或其他修飾的堿基。成對(duì)的lna或其他修飾的堿基可以在條形碼化探針的雙鏈區(qū)中用作更強(qiáng)(或更弱)的堿基對(duì),從而偏好鏈置換反應(yīng)。在一些實(shí)施方案中,至少一個(gè)lna分子位于條形碼化探針的互補(bǔ)鏈上,位于雙鏈條形碼區(qū)和單鏈引物結(jié)合區(qū)之間。
在一些實(shí)施方案中,本公開內(nèi)容的核酸條形碼化探針與分子靶結(jié)合。“分子靶”是任何希望觀察或定量的分子。分子靶的實(shí)例包括但不限于蛋白質(zhì),糖(例如多糖),脂質(zhì),核酸(例如dna,rna,微rna)和小分子。分子靶可以是dna或rna。在一些實(shí)施方案中,分子靶是rna干擾分子,例如短干擾rna(sirna)或微rna(microrna)。在一些實(shí)施方案中,分子靶是反義分子,例如dna反義合成寡核苷酸(aso)。
在一些實(shí)施方案中,分子靶是生物分子。如本文所用,“生物分子”是由生物體產(chǎn)生的任何分子,包括大分子如蛋白質(zhì),多糖,脂質(zhì)和核酸(例如,dna和rna如mrna),以及小分子如初級(jí)代謝產(chǎn)物,次生代謝產(chǎn)物和天然產(chǎn)物。分子靶,特別是生物分子的實(shí)例包括但不限于dna,rna,cdna或經(jīng)歷反轉(zhuǎn)錄的rna的dna產(chǎn)物,a23187(卡西霉素,鈣離子載體),阿維菌素,松香酸,乙酸,乙酰膽堿,肌動(dòng)蛋白,放線菌素d,腺苷,二磷酸腺苷(adp),單磷酸腺苷(amp),三磷酸腺苷(atp),腺苷酸環(huán)化酶,核糖醇,腎上腺素,腎上腺素,促腎上腺皮質(zhì)激素(acth),水母發(fā)光蛋白,黃曲霉毒素,瓊脂,alamethicin,醛固酮,阿侖膦酮,α-淀粉蛋白,尿囊素,烯丙菊酯,α-阿馬丁,氨基酸,淀粉酶,合成代謝類固醇,茴香腦,血管緊張素原,異新霉素,抗利尿激素(adh),阿拉伯糖,精氨酸,子囊霉素,抗壞血酸(維生素c),天冬氨酸,不對(duì)稱二甲基精氨酸,心鈉素(anp),生長素,抗生物素蛋白,印苦楝子素a-c35h44o16,細(xì)菌素,白藜蘆醇,比丘核苷,膽紅素,生物聚合物,生物素(維生素h),布雷菲德菌素a,油菜素內(nèi)酯,布魯寧,尸胺,咖啡因,鈣化醇(維生素d),降鈣素,鈣調(diào)蛋白,鈣調(diào)蛋白,鈣網(wǎng)蛋白,樟腦-(c10h16o),大麻酚,辣椒素,碳水化合物,碳水化合物,肉堿,卡拉膠,酪蛋白,胱天蛋白酶,纖維素酶,纖維素-(c6h10o5),變藍(lán)菌素,西曲溴銨(西三溴銨)-c19h42brn,白屈菜赤堿,色霉素a3,chaparonin,殼多糖,α-氯洛糖,葉綠素,縮膽囊素(cck),膽固醇,膽堿,硫酸軟骨素,肉桂醛,檸檬醛,檸檬酸,香茅醇,瓜氨酸,鈷胺素(維生素b12),輔酶q,秋水仙堿,膠原蛋白,coniine,皮質(zhì)類固醇,皮質(zhì)酮,促腎上腺皮質(zhì)激素釋放激素(crh),皮質(zhì)醇,肌酸,肌酸激酶,結(jié)晶蛋白,α-環(huán)糊精,環(huán)糊精糖基轉(zhuǎn)移酶,,環(huán)鈦酸,半胱氨酸,胱氨酸,松胞菌素,松胞菌素e,細(xì)胞色素,細(xì)胞色素c,細(xì)胞色素c氧化酶,細(xì)胞色素c過氧化物酶,細(xì)胞因子,胞嘧啶-c4h5n3o,脫氧膽酸,don(脫氧新戊酚),脫氧呋喃核糖,脫氧核糖,脫氧核糖核酸(dna),葡聚糖,糊精,dna,多巴胺,酶,麻黃素,腎上腺素-c9h13no3,芥酸-ch3(ch2)7ch=ch(ch2)11cooh,赤蘚糖醇,促紅細(xì)胞生成素(epo),雌二醇,丁子香酚,脂肪酸,纖維蛋白,纖連蛋白,葉酸(維生素m),促卵泡激素(fsh),甲醛,甲酸,formnoci,果糖,fumonisinb1,gamma球蛋白,半乳糖,γ-球蛋白,γ-氨基丁酸,γ-丁內(nèi)酯,γ-羥基丁酸(ghb),胃泌素,明膠,球蛋白,胰高血糖素,葡萄糖胺,葡萄糖-c6h12o6,葡萄糖氧化酶,谷蛋白,谷氨酸,谷氨酰胺,谷胱甘肽,谷蛋白,甘油(甘油),甘氨酸,糖原,乙醇酸,糖蛋白(例如糖蛋白酶如前列腺特異性抗原(psa)),促性腺激素(gnrh),粒酶,綠色熒光蛋白,生長激素,生長激素釋放激素(ghrh),gtp酶,鳥嘌呤,鳥苷,三磷酸鳥苷(+gtp),海珠蛋白,蘇木精,血紅素,血紅蛋白,血藍(lán)蛋白,血紅蛋白,血紅蛋白,硫酸肝素,高密度脂蛋白,hdl,組胺,組氨酸,組蛋白,組蛋白甲基轉(zhuǎn)移酶,hla抗原,同型半胱氨酸,激素,人絨毛膜促性腺激素(hcg),人生長激素,透明質(zhì)酸鹽,透明質(zhì)酸酶,過氧化氫,5-羥甲基胞嘧啶,羥脯氨酸,5-羥基色胺,靛藍(lán)染料,吲哚,肌苷,肌醇,胰島素,胰島素樣生長因子,整合膜蛋白,整合酶,整合素,蛋白質(zhì),干擾素,菊糖,離子霉素,紫羅酮,異亮氨酸,鐵硫簇,k252a,k252b,kt5720,kt5823,角蛋白,激酶,乳糖酶,乳酸,乳糖,羊毛脂,月桂酸,瘦素,輕肌蛋白b,亮氨酸,木質(zhì)素,檸檬烯,芳樟醇,亞油酸,亞麻酸,脂肪酶,脂質(zhì),脂質(zhì)錨定蛋白,脂酰胺,脂蛋白,低密度脂蛋白,ldl,促黃體激素(lh),番茄紅素,賴氨酸,溶菌酶,蘋果酸,麥芽糖,褪黑素,膜蛋白,金屬蛋白,金屬硫蛋白,甲硫氨酸,含羞草素,光神霉素a,絲裂霉素c,單體,霉酚酸,肌紅蛋白,肌球蛋白,天然酚,核酸,赭曲霉毒素a,雌激素,寡肽,寡核苷酸,地衣酚,阿立新,鳥氨酸,草酸,氧化酶,催產(chǎn)素,p53,paba,紫杉醇,泛酸(維生素b5),甲狀旁腺激素(pth),副蛋白質(zhì),豹毒素,歐苷菊,棒曲霉素,蕈青霉素,青霉酸,青霉素,青霉素a,青霉震顫素a,肽酶,胃蛋白酶,肽,表霉素,外周膜蛋白,perosamine,苯乙胺,苯丙氨酸,肌磷酸,磷酸酶,磷脂,苯丙氨酸,植酸,植物激素,多肽,多酚,多糖,卟啉,朊病毒,孕酮,催乳素(prl),脯氨酸,丙酸,魚精蛋白,蛋白酶,蛋白質(zhì),類蛋白,腐胺,除蟲菊酯,吡哆素或吡哆胺(維生素b6),吡咯賴斯,丙酮酸,喹諾酮,蘿沙星,棉子糖,腎素,視黃醇,視黃醇(維生素a),視紫紅質(zhì)(視紫色),核黃素(維生素b2),呋喃核糖,核糖,核酶,蓖麻毒素,rna-核糖核酸,rubisco,黃樟腦,水楊醛,水楊酸,salvinorin-a-c23h28o8,皂苷,秘密蛋白,硒代半胱氨酸,硒代甲硫氨酸,硒蛋白,絲氨酸,絲氨酸激酶,血清素,生長抑素,山梨酸,角鯊烯,星形孢菌素,硬脂酸,白藜蘆醇,甾醇,士的寧,蔗糖(糖),糖(一般的),超氧化物,t2毒素,丹寧酸,鞣酸,酒石酸,牛磺酸,河豚毒素,竹竿蛋白,拓?fù)洚悩?gòu)酶,酪氨酸激酶,牛磺酸,睪酮,四氫大麻酚(thc),河豚毒素,毒胡蘿卜素,thaumatin,硫胺素(維生素b1)-c12h17cln4os·hcl,蘇氨酸,血小板生成素,胸腺嘧啶,胸腺嘧啶,triacsinc,促甲狀腺激素(tsh),促甲狀腺激素釋放激素(trh),甲狀腺素(t4),生育酚(維生素e)三碘甲狀腺原氨酸(t3),跨膜受體,曲古抑菌素a,營養(yǎng)激素,胰蛋白酶,色氨酸,微管蛋白,突觸蛋白,酪氨酸,泛素,尿嘧啶,尿素,尿素酶,尿酸-c5h4n4o3,尿苷,纈氨酸,瓦林霉素,vanabin,加壓素,疣孢菌素,維生素(一般的),維生素a(視黃醇),維生素b,維生素b1(硫胺素),維生素b2(核黃素),維生素b3(尼克酸或煙酸),維生素b4(腺嘌呤),維生素b5(泛酸),維生素b6(吡哆醇或吡哆胺),維生素b12(鈷胺素),維生素c(抗壞血酸),維生素d(促鈣醇),維生素e(生育酚),維生素f,維生素h(生物素),維生素k(萘醌),維生素m(葉酸),渥曼青霉素和木糖。
在一些實(shí)施方案中,分子靶是蛋白質(zhì)靶,例如細(xì)胞環(huán)境的蛋白質(zhì)(例如細(xì)胞內(nèi)或膜蛋白)。蛋白質(zhì)的實(shí)例包括但不限于纖維蛋白如細(xì)胞骨架蛋白(例如肌動(dòng)蛋白,arp2/3,冠狀蛋白,肌營養(yǎng)不良蛋白,ftsz,角蛋白,肌球蛋白,伴肌動(dòng)蛋白,血影蛋白,tau,肌聯(lián)蛋白,原肌球蛋白,微管蛋白和膠原)和細(xì)胞外基質(zhì)蛋白質(zhì)(例如,膠原蛋白,彈性蛋白,f-脊椎動(dòng)物,皮卡丘林和纖連蛋白);球蛋白如血漿蛋白(如血清淀粉樣蛋白p成分和血清白蛋白),凝血因子(如補(bǔ)體蛋白,c1抑制劑和c3轉(zhuǎn)化酶,因子viii,因子xiii,纖維蛋白,蛋白c,蛋白s,蛋白z,蛋白z相關(guān)蛋白酶抑制劑,凝血酶,血管性血友病因子)和急性期蛋白如c反應(yīng)蛋白;血紅素蛋白;細(xì)胞粘附蛋白(例如鈣粘蛋白,室芬靈,整聯(lián)蛋白,ncam和選擇蛋白);跨膜轉(zhuǎn)運(yùn)蛋白(例如cftr,血型糖蛋白d和爬行酶)例如離子通道(例如,配體門控離子通道,如煙堿乙酰膽堿受體和gabaa受體,以及電壓門控離子通道如鉀,鈣和鈉通道),同向運(yùn)輸/反向運(yùn)輸?shù)鞍?如葡萄糖轉(zhuǎn)運(yùn)蛋白);激素和生長因子(例如表皮生長因子(egf),成纖維細(xì)胞生長因子(fgf),血管內(nèi)皮生長因子(vegf),肽激素如胰島素,胰島素樣生長因子和催產(chǎn)素,和類固醇激素如雄激素,雌激素和孕激素);受體如跨膜受體(例如g蛋白偶聯(lián)受體,視紫紅質(zhì))和細(xì)胞內(nèi)受體(如雌激素受體);dna結(jié)合蛋白(例如組蛋白,原蛋白,ci蛋白);轉(zhuǎn)錄調(diào)節(jié)物(例如,c-myc,foxp2,foxp3,myod和p53);免疫系統(tǒng)蛋白(例如,免疫球蛋白,主要組織相容性抗原和t細(xì)胞受體);營養(yǎng)儲(chǔ)存/轉(zhuǎn)運(yùn)蛋白(例如鐵蛋白);伴侶蛋白;和酶。
在一些實(shí)施方案中,靶蛋白是前列腺特異性抗原(psa)。psa(也稱為γ-半乳糖蛋白或激肽釋放酶-3)是klk3基因在人體中編碼的糖蛋白。psa是激肽釋放酶相關(guān)肽酶家族的成員,并且由前列腺的上皮細(xì)胞分泌。
本公開內(nèi)容的核酸條形碼化探針可以是dna,例如d型dna和l型dna和rna,以及其各種修飾。核酸修飾包括堿基修飾,糖修飾和骨架修飾。以下提供這些修飾的非限制性實(shí)例。
可以根據(jù)本公開內(nèi)容使用的修飾的核酸(例如,dna變體)的實(shí)例包括但不限于l-dna(文獻(xiàn)中已知的dna的骨架對(duì)映異構(gòu)體),肽核酸(pna)bispna夾,假互補(bǔ)pna,鎖核酸(lna)和上述的共核酸如dna-lna共核酸。因此,本公開內(nèi)容涉及包含dna,rna,lna,pna或其組合的納米結(jié)構(gòu)。應(yīng)當(dāng)理解,在本公開內(nèi)容的方法和組合物中使用的核酸本質(zhì)上可以是均相或異質(zhì)的。作為實(shí)例,核酸本質(zhì)上可以是完全的dna,或者它們可以由dna和非dna(例如,lna)單體或序列組成。因此,可以使用核酸元件的任何組合。核酸修飾可使核酸在某些條件下更穩(wěn)定和/或更不易于降解。例如,在一些實(shí)施方案中,核酸是耐核酸酶的。
本文還提供了多個(gè)核酸條形碼化探針?!岸鄠€(gè)”包含至少兩個(gè)核酸條形碼化探針。在一些實(shí)施方案中,多個(gè)包含2至2百萬個(gè)核酸條形碼化探針(例如,獨(dú)特的條形碼化探針)。例如,多個(gè)可包含100、500、1000、5000、100、000、100、000、100、000或更多個(gè)核酸條形碼化探針。本發(fā)明并不限定于此。
本文還提供了核酸條形碼化探針對(duì)。這樣的對(duì)旨在彼此組合使用以檢測分子靶空間布置和關(guān)聯(lián)。在一些實(shí)施方案中,核酸條形碼化探針對(duì)包含(a)布置成(i)雙鏈條形碼區(qū)和(ii)引物結(jié)合區(qū)(例如,單鏈引物-結(jié)合區(qū))的第一核酸條形碼化探針,簡單地稱為“第一探針”,和(b)第二單鏈條形碼化探針,其包含條形碼區(qū)和與單鏈引物結(jié)合區(qū)互補(bǔ)的引物區(qū),稱為“第二探針”(參見例如圖10a)。每個(gè)探針通過靶結(jié)合部分附接到分子靶。在含有上述一對(duì)條形碼化探針的無顯微鏡成像反應(yīng)中,回文區(qū)是不必要的,因?yàn)榈诙€(gè)探針(單鏈探針)包括直接與第一個(gè)探針的引物結(jié)合區(qū)結(jié)合的引物。如圖10a所示的例子所示,第二條形碼化探針在一端(例如,遠(yuǎn)離附接到分子靶的末端和/或3'端)含有引物,其與第一探針的引物結(jié)合區(qū)互補(bǔ)并結(jié)合。一旦結(jié)合到第一探針的引物結(jié)合區(qū),第二探針的引物通過第一探針的條形碼區(qū)聚合,從而產(chǎn)生其與第一探針締合的記錄物-第二探針現(xiàn)在包含兩個(gè)不同的條形碼。當(dāng)?shù)谝惶结?其在引物的聚合過程中被置換)的置換鏈在其“重新結(jié)合”到第一探針上的其互補(bǔ)鏈上時(shí)部分地置換第二探針。部分置換的第二探針然后自發(fā)地從第一探針解離。現(xiàn)在包含其與第一探針的關(guān)聯(lián)的記錄物的第二探針可以自由地結(jié)合到另一個(gè)探針并“記錄”該第二關(guān)聯(lián)(參見例如圖10a)。
通常,任何兩個(gè)條形碼化探針可以分別附接到兩個(gè)分子靶。然而,在一些實(shí)施方案中,兩個(gè)條形碼化探針可以附接到相同分子靶(例如,蛋白質(zhì)如抗體)的不同表位,例如,以產(chǎn)生表示溶液中該分子靶存在的記錄物,當(dāng)兩個(gè)這樣的條形碼探針彼此靠近時(shí),創(chuàng)建相同記錄物的許多拷貝(參見例如圖18)。在一些實(shí)施方案中,這允許數(shù)字“計(jì)數(shù)”溶液中的靶分子數(shù)。
圖18顯示了自動(dòng)循環(huán)產(chǎn)生的dna序列在單分子水平上報(bào)告抗體共定位的實(shí)例。具體而言,將隨機(jī)條形碼序列(在該特定圖中被稱為單個(gè)抗體(ab)分子的獨(dú)特分子標(biāo)識(shí)符(umi)和不同ab類型的條形碼)被并入到連接在ab上的dna發(fā)夾探針中。在ab對(duì)共定位在其靶上后,具有umi和樣品條形碼的引物對(duì)分別在3'突出端結(jié)合每個(gè)發(fā)夾探針。聚合酶將引物延伸至合成的“終止子”部位,復(fù)制abumi(1,2)和ab條形碼。然后將延伸的引物通過鏈置換從發(fā)夾部分釋放,并將它們的3'ab條形碼片段(針對(duì)靶蛋白質(zhì)是獨(dú)特的)配對(duì)。這些序列再次延伸,釋放攜帶abumi(1和2)和引物umi(1)的報(bào)告鏈。因此,發(fā)夾探針再生到其初始狀態(tài)并經(jīng)歷另外的循環(huán),在每個(gè)循環(huán)中產(chǎn)生攜帶相同abumi對(duì)(1和2)但不同引物umi(2至n)的報(bào)告鏈。相比之下,如果抗體對(duì)在本體溶液中隨機(jī)相互遇到,而不是在靶上共定位,則它們將僅針對(duì)每個(gè)abumi對(duì)與一個(gè)引物umi產(chǎn)生報(bào)告鏈一次。因此,通過對(duì)報(bào)告鏈進(jìn)行測序來單獨(dú)讀取真正共定位事件產(chǎn)生的信號(hào),并且可以通過在每個(gè)abumi對(duì)上讀取引物umi來容易地丟棄背景報(bào)告鏈。該特征使檢測單一蛋白分子成為可能,并且可以使用例如下一代測序技術(shù)來擴(kuò)大測定。
系統(tǒng)與方法
本文提供的無顯微鏡成像系統(tǒng)包含核酸條形碼化探針,設(shè)計(jì)用于結(jié)合那些探針的引物和置換聚合酶。
“引物”是用作核酸合成起點(diǎn)的單鏈核酸。聚合酶將核苷酸加入引物以產(chǎn)生新的核酸鏈。本公開內(nèi)容的引物被設(shè)計(jì)為與核酸條形碼化探針的引物結(jié)合區(qū)互補(bǔ)并結(jié)合。因此,引物長度和組成(例如,核苷酸組成)至少部分取決于條形碼化探針的引物結(jié)合區(qū)的長度和組成。在一些實(shí)施方案中,引物具有4至40個(gè)核苷酸的長度。例如,引物可以具有長度為4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23,24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個(gè)核苷酸。在一些實(shí)施方案中,引物可以具有4至10、4至15、4至20、4至25、4至30、4至35或4至40個(gè)核苷酸的長度。
引物可以以成對(duì)或其他的組合(例如,在任何幾何形狀中的三聯(lián)體或更多種類)存在,用于例如限制探針結(jié)合符合其幾何標(biāo)準(zhǔn)的那些引物(參見例如圖12)。所示的剛性雙鏈連接在條形碼探針之間實(shí)現(xiàn)最小和最大距離。雙鏈“尺”結(jié)構(gòu)域可以是任何長度(例如,2至100個(gè)核苷酸或更多),并且可以可選地包括條形碼本身,其通過信息內(nèi)容鏈接兩個(gè)半部,如果它們?cè)谔幚砥陂g變得分離。在一些實(shí)施方案中,實(shí)施在其間可能產(chǎn)生記錄物的探針之間的典型距離的雙鏈尺結(jié)構(gòu)域是復(fù)雜結(jié)構(gòu),例如2-,3-或4-dna螺旋束,dna納米結(jié)構(gòu),例如dna折紙結(jié)構(gòu),或增加或改變尺的剛度/硬度的其他結(jié)構(gòu)。
“鏈置換聚合酶”是指能夠置換在核酸合成期間遇到的下游核酸(例如dna)的聚合酶。不同的聚合酶可以具有不同程度的置換活性。鏈置換聚合酶的實(shí)例包括但不限于bst大片段聚合酶(例如,newenglandbiolabs(neb)#m0275),phi29聚合酶(例如neb#m0269),deepventr聚合酶,klenow片段聚合酶和修飾的taq聚合酶??紤]了其它鏈置換聚合酶。
在一些實(shí)施方案中,引物包含相對(duì)于單鏈引物結(jié)合區(qū)的至少一個(gè)核苷酸錯(cuò)配??梢允褂眠@種不匹配來促進(jìn)半記錄物從條形碼化探針的互補(bǔ)鏈的置換(參見例如圖9d)。在一些實(shí)施方案中,引物包含至少一個(gè)人造接頭。
如本文所提供的無顯微鏡成像反應(yīng)的“循環(huán)速率”是指由兩個(gè)最近的條形碼分子靶的循環(huán)相互作用而產(chǎn)生完整記錄物(相對(duì)于半記錄物)的速率。在一些實(shí)施方案中,包含錯(cuò)配或人造接頭的引物將循環(huán)速率提高5倍至10倍或更多。
在一些實(shí)施方案中,本公開內(nèi)容的無顯微鏡成像系統(tǒng)還包含與單鏈引物結(jié)合區(qū)部分互補(bǔ)的輔助核酸鏈,其與鄰近引物結(jié)合區(qū)的單鏈區(qū)部分互補(bǔ),以及與鄰近引物結(jié)合區(qū)的單鏈區(qū)短暫結(jié)合(參見例如圖9f)?!拜o助鏈”允許聚合酶引發(fā)聚合反應(yīng),同時(shí)也允許存在失配,如上所述。在一些實(shí)施方案中,輔助鏈長度為3至20個(gè)核苷酸。例如,輔助鏈可以具有3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)核苷酸的長度。
本文提供了檢測分子靶相互作用(例如彼此)的方法。在一些實(shí)施方案中,所述方法包括以下步驟:(a)將本文提供的至少一個(gè)(例如多個(gè))核酸條形碼化探針,含有至少一種分子靶的樣品,與多個(gè)核酸條形碼化探針的探針的單鏈引物結(jié)合區(qū)互補(bǔ)的引物和鏈置換聚合酶接觸,和(b)在允許產(chǎn)生條形碼化記錄物的條件下孵育樣品。
在一些實(shí)施方案中,所述方法包括以下步驟:使本文提供的核酸條形碼化探針對(duì)與包含至少兩個(gè)分子靶的樣品和鏈置換聚合酶接觸,和(b)在允許生成條形碼化記錄物的條件下(例如,在允許核酸復(fù)制的條件下)孵育樣品。
“樣品”可以包含一個(gè)或多個(gè)細(xì)胞,組織或體液如血液(血清和/或血漿),尿液,精液,淋巴液,腦脊液或羊水。樣品可以獲自(或衍生自)任何來源,包括但不限于人,動(dòng)物,細(xì)菌,病毒,微生物和植物。在一些實(shí)施方案中,樣品是細(xì)胞裂解物或組織裂解物。樣品還可以包含來自一個(gè)來源或不同來源的材料的混合物。樣品可以是空間區(qū)域或體積(例如,陣列上的網(wǎng)格,或板或盤中的孔)。
在一些實(shí)施方案中,樣品是單細(xì)胞,例如稀有細(xì)胞。稀有細(xì)胞的實(shí)例包括但不限于循環(huán)腫瘤細(xì)胞,上皮祖細(xì)胞和干細(xì)胞,間充質(zhì)細(xì)胞和胎兒細(xì)胞,例如在血流中循環(huán)的。
“允許產(chǎn)生條形碼化記錄物的條件”可以是生理?xiàng)l件(例如,溫度為20-40攝氏度,大氣壓力為1,和/或ph值為6-8)。
在一些實(shí)施方案中,步驟(b)在20至40攝氏度(℃)的溫度下進(jìn)行。例如,步驟(b)可以在20℃,21℃,22℃,23℃,24℃,25℃,26℃,27℃,28℃,29℃,31℃,32℃,33℃,34℃,35℃,36℃,37℃,38℃,39℃或40℃的溫度下進(jìn)行。
在一些實(shí)施方案中,步驟(b)進(jìn)行10分鐘(分鐘)至24小時(shí)或更長時(shí)間。例如,步驟(b)可以進(jìn)行10分鐘至3小時(shí)(小時(shí)),10分鐘至12小時(shí),10分鐘至18小時(shí)或10分鐘至24小時(shí)的時(shí)間。在一些實(shí)施方案中,步驟(b)進(jìn)行10分鐘,15分鐘,20分鐘,25分鐘,30分鐘,35分鐘,40分鐘,45分鐘,50分鐘,55分鐘,60分鐘,65分鐘,70分鐘,75分鐘,80分鐘,85分鐘,90分鐘,95分鐘,100分鐘,105分鐘,110分鐘,115分鐘,120分鐘,125分鐘,130分鐘,135分鐘,140分鐘,145分鐘,150分鐘,155分鐘,160分鐘,165分鐘,170分鐘,175分鐘或180分鐘的時(shí)間。
在一些實(shí)施方案中,無顯微鏡成像反應(yīng)可以具有0.25-15mmmg和/或50-250mmna的鹽濃度。
在一些實(shí)施方案中,無顯微鏡成像反應(yīng)可具有0.05-5mm的反應(yīng)dntp濃度(例如,0.05mm,0.10mm,0.15mm,0.20mm,0.25mm,0.30mm,0.35mm,0.40mm,0.45mm,0.50mm,1.0mm,1.5mm,2.0mm,2.5mm,3.0mm,3.5mm,4.0mm,4.5mm或5.0mm。
可用于無顯微鏡成像反應(yīng)的緩沖液包括但不限于“thermo-polbuffer”(newenglandbiolabs),磷酸鹽緩沖鹽水(含或不含mg或na補(bǔ)充),任何商業(yè)或?qū)嶒?yàn)室制備的細(xì)胞培養(yǎng)基,補(bǔ)充有足以進(jìn)行dna雜交和聚合酶操作的陽離子鹽的任何ph-緩沖溶液或水。
在一些實(shí)施方案中,本文提供的無顯微鏡成像反應(yīng)的循環(huán)速率為每對(duì)探針每10分鐘1次完整記錄物,但可以與每秒1個(gè)完整記錄物一樣快,或者像在某些(例如,更嚴(yán)格的)條件下每10個(gè)小時(shí)1個(gè)完整記錄物一樣緩慢。
在無顯微鏡成像“循環(huán)”結(jié)束時(shí),產(chǎn)生條形碼化靶的空間配置的核酸記錄物(簡稱為“記錄物”)(參見例如圖3a)。在一些實(shí)施方案中,記錄物是雙鏈的。在一些實(shí)施方案中,記錄物是單鏈的。記錄物的長度可能會(huì)有所不同。例如,條形碼化記錄物可以具有30至500個(gè)核苷酸(或核苷酸堿基對(duì))的長度。在一些實(shí)施方案中,條形碼化記錄物的長度為30至100、30至200、30至300、30至400、50至100、50至200、50至300、50至400或50至500個(gè)核苷酸(或核苷酸堿基對(duì))。在一些實(shí)施方案中,條形碼化記錄物的長度為80至100個(gè)核苷酸(或核苷酸堿基對(duì))或90個(gè)核苷酸(或核苷酸堿基對(duì))。
記錄物可以通過聚合酶介導(dǎo)的機(jī)制從探針“釋放”,或通過擴(kuò)增的引物從探針上的引物結(jié)合區(qū)自發(fā)釋放。在一些實(shí)施方案中,如圖14所示,延伸引物的3'末端可以被設(shè)計(jì)成自身折回并延伸出探針。由于本公開內(nèi)容的無顯微鏡成像系統(tǒng)通常不將成對(duì)的條形碼復(fù)制到相同的記錄物鏈上,所以可以將額外的條形碼添加到在信息內(nèi)容中連接記錄物對(duì)的類似尺的引物。
在產(chǎn)生條形碼化記錄物之后,收集它們,并且在一些實(shí)施方案中被純化。例如,可以將記錄物收集在反應(yīng)的上清液中或通過收集反應(yīng)容器的全部內(nèi)容物來收集。進(jìn)一步制備記錄物用于測序可能會(huì)進(jìn)行平臺(tái)特異性測序。一些平臺(tái)可能不需要進(jìn)一步的準(zhǔn)備,但通常記錄物必須具有以下的組合:(1)測序特異性“銜接子”或加入其末端的其他寡核苷酸,(2)進(jìn)行“擴(kuò)增”反應(yīng)(例如聚合酶鏈反應(yīng)pcr)),其中產(chǎn)生相同或幾乎相同(例如99%,98%,95%,90%,80%相同)的記錄物(具有或不具有“銜接子”序列)的拷貝,和(3)從可能干擾制備或測序的其他序列,蛋白質(zhì)或反應(yīng)組分的純化。例如,銜接子序列可以使用常見的“a-加尾”技術(shù)附接到記錄物,然后進(jìn)行凝膠電泳純化,最后進(jìn)行pcr擴(kuò)增?;蛘?,一些實(shí)施方案可以直接進(jìn)行記錄物的pcr擴(kuò)增,可能通過長dna引物添加銜接子序列,或隨后進(jìn)行銜接子連接和凝膠純化。
在一些實(shí)施方案中,可以使用兩種或更多種類型的記錄引物來例如促進(jìn)隨后的pcr擴(kuò)增或用于測序的準(zhǔn)備。每個(gè)引物可以具有相同的探針結(jié)合序列,但在不涉及記錄物反應(yīng)的另外的5'序列上不同。在兩種引物類型的情況下,所有得到的記錄物的平均一半將具有不同的非互補(bǔ)的5'和3'末端。這些可以用于進(jìn)一步擴(kuò)增(例如,通過使末端更容易與可溶性pcr引物雜交而不是形成發(fā)夾莖),連接或其它加工。例如,如果使用10種類型的這種記錄引物,則所有記錄物的平均90%將具有不同的非互補(bǔ)的5'和3'末端,進(jìn)一步有助于末端特異性擴(kuò)增和加工。
在一些實(shí)施方案中,條形碼化記錄物通過凝膠電泳直接觀察或通過pcr進(jìn)行擴(kuò)增和定量來“解碼”(參見例如圖19c)。該示例依賴于其記錄引物或條形碼中基于不同序列的特定記錄物的特異性擴(kuò)增。大量平行測序也包括在本公開內(nèi)容中,并且可以用于解碼大系統(tǒng)中精確的單個(gè)分子布置(參見例如圖3f)。
然后對(duì)收集的條形碼化記錄物進(jìn)行測序。在一些實(shí)施方案中,使用下一代測序技術(shù)對(duì)記錄物進(jìn)行測序。在一些實(shí)施方案中,使用sanger測序以及正在開發(fā)的“下一代測序”技術(shù),例如“基于納米孔”的測序(例如,oxfordnanoporetechnologies,nanooretech.com)。在簡化的系統(tǒng)中,例如,可以使用電泳凝膠來檢測記錄物中條形碼的組合,通過區(qū)分產(chǎn)生的記錄物的長度(參見例如圖3b),或者可以使用標(biāo)準(zhǔn)分辨率或超分辨率顯微鏡通過熒光原位雜交或類似方法目測檢測探針序列?;蛘?,核酸微陣列(例如,agilenttechnologies)可以用于以序列特異性方式檢測記錄物。
圖13a-13b顯示了用于處理?xiàng)l形碼化記錄物的本公開內(nèi)容的連接和擴(kuò)增方法的實(shí)例。例如,可以用限制性內(nèi)切核酸酶切割記錄物,然后通過“粘性”末端連接(圖13a)??梢杂靡环N或多種內(nèi)切核酸酶切割過多的未連接的記錄物材料(圖13b)。將測序銜接子附接到記錄物的過程可以通過平末端“a-加尾”或限制性位點(diǎn)介導(dǎo)的連接進(jìn)行。連接可以在原始的雙鏈記錄物上或在退火成發(fā)夾后進(jìn)行。此外,引物可以不是作為單一種類加入,而是作為可以通過不主動(dòng)參與記錄物產(chǎn)生反應(yīng)本身但允許大多數(shù)記錄物的兩端不同的5'延伸來區(qū)分的任何數(shù)量的種類(未示出)。這進(jìn)而允許在每個(gè)末端使用不同引物進(jìn)行pcr擴(kuò)增,可能并入測序銜接子,并且該擴(kuò)增可以在連接之前或之后進(jìn)行。在一些實(shí)施方案中,外切核酸酶(作為單一酶或組合,例如t7外切核酸酶與外切核酸酶i,iii或t組合)可以用于消化過量銜接子或其他序列,其中靶連接序列通過末端保護(hù)或環(huán)形成免于消化修改。
從獲得的測序數(shù)據(jù)可以確定條形碼分子靶相對(duì)于彼此的空間布置。例如,可以計(jì)算地處理測序數(shù)據(jù)以產(chǎn)生分子靶相互作用的代表性網(wǎng)絡(luò)。這樣的計(jì)算機(jī)代碼可以讀取測序數(shù)據(jù)文件,創(chuàng)建相關(guān)條形碼的數(shù)字編碼網(wǎng)絡(luò)(例如,從讀取記錄物#1導(dǎo)出的“連接到b的條形碼a”,來自記錄物#2的“b-c”和來自記錄物#3的“c-a”)。任何數(shù)量的市售(例如,mathematica)或獨(dú)立編寫的代碼然后可用于將該非幾何數(shù)字表示變換成描述相對(duì)空間定位(在數(shù)學(xué)上被稱為“圖論”的方面)的描述。在這種情況下,記錄物意味著與a,b和c相關(guān)聯(lián)的靶的三角形定位。此外,這樣的程序可以通過分析與蛋白質(zhì)相關(guān)聯(lián)的所有條形碼的相互作用來計(jì)算例如與條形碼a相關(guān)聯(lián)的蛋白質(zhì)的相互作用的統(tǒng)計(jì)學(xué)(先驗(yàn)已知,因?yàn)榘邢虿糠挚梢栽诎邢蚝头磻?yīng)之前連接到特定的條形碼集)。此外,可以通過分析在不同時(shí)間取得的不同記錄物集或提供分子時(shí)間標(biāo)記(例如,在反應(yīng)的后半部分中加入輕微差異的引物),可以從這些數(shù)據(jù)確定相互作用的時(shí)間依賴性。
本公開內(nèi)容的一些方面提供了包括在單個(gè)反應(yīng)將以下組合的方法:(a)兩個(gè)單鏈核酸條形碼化探針,每個(gè)包含回文序列,條形碼序列和引物結(jié)合序列,其中條形碼序列彼此不同并且其中每個(gè)條形碼化探針附接到分子靶上,(b)部分雙鏈引物,其布置成雙鏈區(qū),其側(cè)翼為3'單鏈側(cè)翼區(qū),每個(gè)含有引物與引物結(jié)合序列互補(bǔ)的引物,其中所述雙鏈區(qū)含有可逆共價(jià)結(jié)合位點(diǎn)(參見例如圖11)和鏈置換聚合酶。
在一些實(shí)施方案中,可逆共價(jià)結(jié)合位點(diǎn)含有cnvk修飾(參見例如美國專利號(hào)8,481,714),使得兩條鏈可以在存在紫外光的同時(shí)共價(jià)結(jié)合,并且隨后在差異波長的光存在的情況下釋放??梢允褂闷渌鼫囟确€(wěn)定的可逆連接,如本文所提供的。
在一些實(shí)施方案中,所述方法包括在足以允許引物與引物結(jié)合位點(diǎn)的結(jié)合和并引物的每個(gè)3'側(cè)翼區(qū)的延伸的條件下孵育(a)和(b)。
在一些實(shí)施方案中,所述方法包括將反應(yīng)加熱至至少50℃(例如50℃至100℃)的溫度,以允許引物從兩條單鏈核酸條形碼化探針分離,由此再生(a)和(b)用于進(jìn)一步的溫度驅(qū)動(dòng)循環(huán)。
圖11顯示了本公開內(nèi)容的溫度依賴性自動(dòng)循環(huán)機(jī)制的示例。循環(huán)創(chuàng)建記錄物,每個(gè)記錄物來自兩個(gè)獨(dú)特的探針上的兩個(gè)獨(dú)特的引物。新生的“半記錄物”不是從探針自發(fā)驅(qū)動(dòng)的,而是在升高的溫度下“熔化”。探針和引物如圖11所示,引物為通過uv-可逆共價(jià)交聯(lián)cnvk部分連接在一起的雙3'-頭結(jié)構(gòu)。引物結(jié)合任何一對(duì)探針,在低(例如25℃)溫度下延伸以復(fù)制條形碼,并且當(dāng)溫度升高到高于鏈的熔融溫度(例如70℃)時(shí)釋放。在再次降低溫度時(shí),溶液中的聚合酶可以完成通過結(jié)合回文序列連接的鏈的復(fù)制,在一些實(shí)施方案中,通過cnvk連接的釋放來輔助。因此,系統(tǒng)與溫度循環(huán)同步驅(qū)動(dòng)。
本發(fā)明通過以下實(shí)施例進(jìn)一步說明,其實(shí)際上不應(yīng)被解釋為進(jìn)一步的限制。在此整個(gè)申請(qǐng)中引用的所有參考文獻(xiàn)(包括文獻(xiàn)參考文獻(xiàn),已發(fā)明專利,公開專利申請(qǐng)和共同未決的專利申請(qǐng))的全部內(nèi)容特別地通過引用并入本文,特別是對(duì)于本文所引用的教導(dǎo)。
本公開內(nèi)容的方面進(jìn)一步由以下編號(hào)的段落定義:
1.一種核酸條形碼化探針,包括:
被布置成形成具有部分雙鏈的引物結(jié)合區(qū)、雙鏈的條形碼區(qū)、雙鏈回文區(qū)和含有靶結(jié)合部分的單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)的核酸,其中終止聚合的分子位于所述雙鏈回文區(qū)和所述環(huán)區(qū)之間。
2.一種核酸條形碼化探針,其包含一個(gè)或多個(gè)核酸鏈,所述一個(gè)或多個(gè)核酸鏈被布置成:
(a)雙鏈回文區(qū);
(b)雙鏈條形碼區(qū);和
(c)引物結(jié)合區(qū)。
3.段落2的核酸條碼探針,其中引物結(jié)合區(qū)是單鏈的。
4.段落2的核酸條碼探針,其中引物結(jié)合區(qū)是部分雙鏈的。
5.段落1-4中任一項(xiàng)的核酸條形碼化探針,其中所述雙鏈回文區(qū)具有4至10個(gè)核苷酸堿基對(duì)的長度。
6.段落1-5中任一項(xiàng)所述的核酸條形碼化探針,其中所述雙鏈條形碼區(qū)具有2至100個(gè)核苷酸堿基對(duì)的長度。
7.段落1-6中任一項(xiàng)的核酸條形碼化探針,其中引物結(jié)合區(qū)具有4至40個(gè)核苷酸的長度。
8.段落2-7中任一項(xiàng)的核酸條形碼化探針,其中條形碼化探針進(jìn)一步包含與雙鏈回文區(qū)鄰近的終止聚合的分子或修飾。
9.段落2-7中任一項(xiàng)所述的核酸條形碼化探針,其中所述條形碼化探針進(jìn)一步包含鄰近所述雙鏈回文區(qū)的終止聚合的合成非dna接頭。
10.段落2-7中任一項(xiàng)所述的核酸條形碼化探針,其中所述條形碼化探針進(jìn)一步包含鄰近所述雙鏈回文區(qū)的三乙二醇間隔子,其終止聚合。
11.段落8-10中任一項(xiàng)所述的核酸條形碼化探針,其中所述條形碼化探針包含鄰近終止聚合的分子或修飾的雙鏈置換區(qū)。
12.段落11的核酸條碼編碼探針,其中所述雙鏈置換區(qū)具有2至10個(gè)核苷酸堿基對(duì)的長度。
13.段落2-9中任一項(xiàng)所述的核酸條形碼化探針,其中所述條形碼化探針被布置成形成包含單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)。
14.段落1或13的核酸條形碼化探針,其中單鏈環(huán)區(qū)具有3至50個(gè)核苷酸的長度。
15.段落2-14中任一項(xiàng)的核酸條形碼化探針,其進(jìn)一步包含靶結(jié)合部分。
16.段落13或14的核酸條碼編碼的探針,其還包含附接到單鏈環(huán)區(qū)的靶結(jié)合部分。
17.根據(jù)段落1,15或16中任一項(xiàng)所述的核酸條形碼化探針,其中所述靶結(jié)合部分選自:生物素,抗體,適體,納米體,核酸,藥物和一個(gè)原子
18.段落1-17中任一項(xiàng)的核酸條碼編碼探針,其中所述探針包含至少一個(gè)鎖核酸(lna)核苷酸。
19.段落18的核酸條碼編碼探針,其中至少一個(gè)lna核苷酸位于雙鏈條形碼區(qū)中或鄰近雙鏈條形碼區(qū)。
20.段落1-19中任一項(xiàng)所述的核酸條形碼化探針,其中所述探針還包含單鏈多聚t末端序列。
21.段落1或15-20中任一項(xiàng)的核酸條形碼化探針,其中所述探針通過靶結(jié)合部分與分子靶結(jié)合。
22.段落1-21中任一項(xiàng)的多個(gè)核酸條形碼化探針。
23.段落22的多個(gè)核酸條形碼化探針,其中所述雙鏈回文區(qū)對(duì)于所述多個(gè)核酸條形碼化探針的每個(gè)探針是相同的。
24.段落22或23的多個(gè)核酸條形碼化探針,其中所述雙鏈條形碼區(qū)對(duì)于所述多個(gè)核酸條形碼化探針的每個(gè)探針是獨(dú)特的。
25.段落22或23的多個(gè)核酸條形碼化探針,其中所述多個(gè)核酸條形碼化探針包括條形碼化探針的子集,每個(gè)子集包括獨(dú)特的條形碼區(qū)。
26.段落22-25中任一項(xiàng)中的多個(gè)核酸條形碼化探針,其中所述單鏈引物結(jié)合區(qū)對(duì)于所述多個(gè)核酸條形碼化探針的每個(gè)探針是相同的。
27.段落25的多個(gè)核酸條形碼化探針,其中單鏈引物結(jié)合區(qū)對(duì)于所述多個(gè)核酸條形碼化探針的條形碼化探針的每個(gè)子集是獨(dú)特的。
28.段落22-26中的任一項(xiàng)的多個(gè)核酸條形碼化探針,其中所述多個(gè)核酸條形碼化探針的每個(gè)探針通過靶結(jié)合部分與分子靶結(jié)合。
29.一種組合物,其包含段落22-26中的任一項(xiàng)的多個(gè)核酸條形碼化探針和與所述多個(gè)核酸條形碼化探針的探針的引物結(jié)合區(qū)至少部分互補(bǔ)的引物。
30.段落29的組合物,其中所述引物包含相對(duì)于引物結(jié)合區(qū)的至少一個(gè)核苷酸錯(cuò)配。
31.段落29的組合物,其中所述引物包含至少一個(gè)與引物結(jié)合區(qū)不互補(bǔ)和/或不結(jié)合引物結(jié)合區(qū)的人造接頭。
32.段落29-31中任一項(xiàng)的組合物,還包含鏈-置換聚合酶。
33.段落32的組合物,其中鏈置換聚合酶選自:bst大片段聚合酶,phi29聚合酶,deepventr聚合酶,klenow片段聚合酶和修飾的taq聚合酶。
34.段落29-33中任一項(xiàng)所述的組合物,其還包含輔助核酸鏈,所述輔助核酸鏈與所述單鏈引物結(jié)合區(qū)部分互補(bǔ),與鄰近所述引物結(jié)合區(qū)的單鏈區(qū)部分互補(bǔ),并且與鄰近所述引物結(jié)合區(qū)的所述單鏈區(qū)短暫地結(jié)合。
35.段落34的組合物,其中所述輔助鏈長度為3至20個(gè)核苷酸。
36.一種檢測分子靶相互作用的方法,包括以下步驟:
(a)將權(quán)利要求28的多個(gè)核酸條形碼化探針與(i)與所述多個(gè)核酸條形碼化探針的探針的引物結(jié)合區(qū)互補(bǔ)的引物和(ii)鏈置換聚合酶在單一反應(yīng)中組合;和
(b)在導(dǎo)致產(chǎn)生條形碼化記錄物的條件下孵育所述反應(yīng)。
37.段落36的方法,其中條形碼化記錄物是雙鏈的。
38.段落36或37的方法,其中(b)的步驟包括在生理?xiàng)l件下孵育反應(yīng)。
39.根據(jù)段落36或37所述的方法,其中步驟(b)包括在37℃的溫度下孵育反應(yīng)0.5至3.0小時(shí)。
40.如段落36-39中任一項(xiàng)所述的方法,其中所述多個(gè)核酸條形碼化探針在生成所述雙鏈條形碼化記錄物之后再生。
41.根據(jù)段落36-40中任一項(xiàng)所述的方法,還包括從所述反應(yīng)中收集條形碼化記錄物。
42.段落41的方法,還包括純化從反應(yīng)中收集的條形碼化記錄物。
43.段落42的方法,還包括測序從反應(yīng)收集的條形碼化記錄物,從而產(chǎn)生測序數(shù)據(jù)。
44.段落43的方法,還包括從測序數(shù)據(jù)重建分子靶相互作用的圖像。
45.段落41的方法,還包括將條形碼化記錄物附加到序列特異性銜接子。
46.段落45的方法,其中將條形碼化記錄物附加到序列特異性銜接子包括:
(i)將雙鏈條形碼化記錄物解離為單鏈條形碼化記錄物;
(ii)使每條單鏈條形碼化記錄物自退火以形成發(fā)夾結(jié)構(gòu);和
(iii)將每個(gè)發(fā)夾結(jié)構(gòu)連接到銜接子序列,從而形成銜接子-條形碼化記錄物。
47.段落46的方法,還包括通過聚合酶鏈反應(yīng)(pcr)擴(kuò)增銜接子-條形碼化記錄物,從而產(chǎn)生銜接子-條形碼化記錄物的拷貝。
48.根據(jù)權(quán)利要求47所述的方法,還包括純化銜接子-條形碼化記錄物的拷貝,由此產(chǎn)生銜接子條形碼化記錄物的純化拷貝。
49.段落48的方法,還包括對(duì)銜接子條形碼化記錄物的純化拷貝進(jìn)行測序,從而確定條形碼化記錄物的順序。
50.段落49的方法,還包括計(jì)算地處理?xiàng)l形碼化記錄物的序列以產(chǎn)生分子靶相互作用的代表性網(wǎng)絡(luò)。
51.段36-50中任一項(xiàng)的方法,其中所述引物包含:
第一核酸鏈,其包含
與單鏈引物結(jié)合區(qū)互補(bǔ)的第一序列
和第二序列;和
第二核酸鏈,其包含
與單鏈引物結(jié)合區(qū)互補(bǔ)的第三序列
和與所述第二序列互補(bǔ)并與其結(jié)合的第四序列,
其中所述第一和第二核酸鏈被布置成由單鏈引物區(qū)側(cè)接的雙鏈區(qū)。
52.段落51的方法,其中雙鏈區(qū)包含條形碼序列。
53.段落51或52的方法,其中所述引物還包含至少一個(gè)測序位點(diǎn)或附接位點(diǎn)。
54.根據(jù)段落36-53中任一項(xiàng)所述的方法,其中所述分子靶是從生物樣品獲得的。
55.段落54的方法,其中所述生物樣品是細(xì)胞或細(xì)胞裂解物。
核酸條形碼化探針對(duì),包括:
(a)第一核酸條形碼化探針,其被布置成
(i)雙鏈條形碼區(qū),和
(ii)單鏈引物結(jié)合區(qū);
和
(b)包含條形碼區(qū)和與單鏈引物結(jié)合區(qū)互補(bǔ)的引物區(qū)的第二單鏈條形碼化探針。
57.段落56的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針的雙鏈條形碼區(qū)具有5至50個(gè)核苷酸堿基對(duì)的長度。
58.段落56的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針的單鏈引物結(jié)合區(qū)具有4至50個(gè)核苷酸的長度。
59.段落56的核酸條形碼化探針對(duì),其中所述第二核酸條形碼化探針的條形碼區(qū)具有5至50個(gè)核苷酸的長度。
60.段落56的核酸條形碼化探針對(duì),其中所述第二核酸條形碼化探針的引物區(qū)具有4至50個(gè)核苷酸的長度。
61.段落56的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針進(jìn)一步包含鄰近所述雙鏈條形碼區(qū)的終止聚合的分子或修飾。
62.段落61的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針進(jìn)一步包含鄰近所述雙鏈條形碼區(qū)的終止聚合的合成的非dna接頭。
63.段落61的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針包含鄰近所述終止聚合的分子或修飾的雙鏈置換區(qū)。
64.段落63的核酸條形碼化探針對(duì),其中所述雙鏈置換區(qū)具有2至10個(gè)核苷酸堿基對(duì)的長度。
65.段落56的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針被布置成形成包含單鏈環(huán)區(qū)的發(fā)夾結(jié)構(gòu)。
66.段落65的核酸條形碼化探針對(duì),其中所述單鏈環(huán)區(qū)具有3至50個(gè)核苷酸的長度。
67.段落65的核酸條形碼化探針對(duì),其中所述單鏈環(huán)區(qū)含有(ii)的單鏈引物結(jié)合區(qū)。
68.段落56的核酸條形碼化探針對(duì),其中所述第一核酸條形碼化探針和/或所述第二核酸條形碼化探針進(jìn)一步包含靶結(jié)合部分。
69.段落68的核酸條形碼化探針對(duì),其中靶結(jié)合部分位于遠(yuǎn)離第一核酸條形碼化探針的單鏈引物結(jié)合區(qū)的末端和/或位于遠(yuǎn)離第二核酸條形碼化探針的引物區(qū)的末端。
70.段落69的核酸條形碼化探針對(duì),其中所述靶結(jié)合部分選自:生物素,抗體,適體,納米體和核酸。
71.段落68的核酸條形碼化探針對(duì),其中第一核酸條形碼化探針和第二核酸條形碼化探針中的每一個(gè)通過靶結(jié)合部分與分子靶結(jié)合。
72.一種組合物,其包含段落56的核酸條形碼化探針對(duì)和布置成雙鏈條碼區(qū)和單鏈引物結(jié)合區(qū)的第三核酸條形碼化探針,其中所述單鏈引物結(jié)合區(qū)與第二核酸條形碼化探針的引物區(qū)互補(bǔ)并結(jié)合。
73.段落72的組合物,其中所述第三核酸條形碼化探針還包含靶結(jié)合部分。
74.段落73的組合物,其中所述第三核酸條形碼化探針通過與分子靶結(jié)合的靶結(jié)合部分結(jié)合到分子靶。
75.一種組合物,其包含段落56的核酸條形碼化探針對(duì)和鏈置換聚合酶。
76.段落75的組合物,其中所述鏈置換聚合酶選自:bst大片段聚合酶,phi29聚合酶,deepventr聚合酶,klenow片段聚合酶和修飾的taq聚合酶。
77.檢測分子靶相互作用的方法,包括以下步驟:
(a)將段落71的核酸條碼探針對(duì)與鏈置換聚合酶在單一反應(yīng)中組合;和
(b)在導(dǎo)致產(chǎn)生單鏈條形碼化記錄物的條件下孵育所述反應(yīng)。
78.檢測分子靶相互作用的方法,其包括以下步驟:
在單一反應(yīng)中組合:(a)兩個(gè)單鏈核酸條形碼化探針,其各自包含回文序列、條形碼序列和引物結(jié)合序列,其中條形碼序列彼此不同,并且其中每個(gè)條形碼化探針附接到分子靶,(b)部分雙鏈引物,其被布置成由各自含有引物與引物結(jié)合序列互補(bǔ)的3'單鏈側(cè)翼區(qū)側(cè)接的雙鏈區(qū),其中雙鏈區(qū)含有可逆共價(jià)結(jié)合位點(diǎn);以及鏈置換聚合酶;
在足以允許引物與引物結(jié)合位點(diǎn)結(jié)合和引物的每個(gè)3'側(cè)翼區(qū)的延伸的條件下孵育(a)和(b);和
將反應(yīng)加熱到至少50℃的溫度以允許引物從所述兩個(gè)單鏈核酸條形碼化探針解離,從而再生(a)和(b)。
實(shí)施例
實(shí)施例1。
圖3示出來自實(shí)驗(yàn)的數(shù)據(jù),其中顯示了基于鄰近的自動(dòng)循環(huán)完整記錄物生成方法的示例。電泳凝膠的泳道1-4各自含有不同長度和定位的條形碼化探針(凝膠上方)的組合以及引物和聚合酶(未描繪)。在泳道1中,短和長條形碼化探針在溶液中不連接。cy5標(biāo)記的引物(大量過量)轉(zhuǎn)化為短或長半記錄物,但由于探針彼此不鄰近,因此沒有產(chǎn)生完整記錄物。在泳道2中,短條形碼化探針共同定位在鏈霉親和素分子上,產(chǎn)生短的半記錄物,隨后產(chǎn)生短的完整記錄物。當(dāng)使用短或長探針制備鏈霉親和素時(shí),然后混合在一起進(jìn)行反應(yīng)(泳道3),產(chǎn)生短和長長度的半記錄物和完整記錄物,進(jìn)一步表明條形碼化探針彼此接近,或當(dāng)完整記錄物產(chǎn)生時(shí),只在局部地進(jìn)行相互作用。泳道4包含與泳道3加上共同定位的短和長探針相同的組分,這導(dǎo)致產(chǎn)生中長度完整記錄物,結(jié)合短和長半記錄物。不同長度的探針僅用于在本實(shí)驗(yàn)中將凝膠上的記錄物長度(因此移動(dòng)性)區(qū)分開來。
這種功能性自動(dòng)循環(huán)反應(yīng)允許在恒定的生理溫度和條件下重復(fù)的條形碼化探針讀數(shù)。自動(dòng)循環(huán),結(jié)合允許單個(gè)分子的區(qū)分的獨(dú)特的條形碼標(biāo)記,實(shí)現(xiàn)真正的網(wǎng)絡(luò)解釋和成像(圖3),精確度是顯微鏡和常見的成對(duì)鄰近方法不能匹配的。使用常見的成對(duì)鄰近技術(shù)(例如共免疫沉淀,鄰近連接)的記錄本質(zhì)上是破壞性的,并且在不重復(fù)取樣的情況下,個(gè)體網(wǎng)絡(luò)(圖2b)的解釋是不可能的。
實(shí)施例2。
設(shè)計(jì)合成的dna納米結(jié)構(gòu),以納米精度的任意用戶指定位置顯示dna條形碼,從而成為以嚴(yán)謹(jǐn)和精確的方式評(píng)估自動(dòng)循環(huán)儀的性能和隨后的圖像重建方法的“工作臺(tái)”。使用樣品處理技術(shù)(例如,微流體裝置)以及用于基于完整記錄物序列的成像重建的計(jì)算算法和軟件工具。然后將細(xì)胞表面上的蛋白質(zhì)受體簇成像,首先在固定細(xì)胞中,然后在活細(xì)胞中成像。表面蛋白質(zhì)簇的標(biāo)記使用抗體和較小的粘合劑(例如納米抗體或適體)來實(shí)現(xiàn)。將無顯微鏡成像(mfi)結(jié)果與使用超高分辨率顯微鏡的方法獲得的數(shù)據(jù)進(jìn)行比較。然后,mfi應(yīng)用于另一個(gè)應(yīng)用:高通量、高分辨率成像核體組織。最后,除了基于鄰近的自動(dòng)循環(huán)記錄儀之外,還開發(fā)了一種基于擴(kuò)散的分子記錄儀,可以對(duì)遠(yuǎn)距離分離的靶重復(fù)產(chǎn)生分子記錄物,進(jìn)一步擴(kuò)大mfi的容量。
實(shí)施例3。
在細(xì)胞膜上的蛋白質(zhì)簇成像
可以使用本公開內(nèi)容的方法和組合來成像和闡明細(xì)胞質(zhì)膜中的蛋白質(zhì)簇。例如,erbb家族的四個(gè)類似的膜結(jié)合的egf受體形成了在細(xì)胞表面上具有13個(gè)其他多肽配體的復(fù)雜的、模塊化的異質(zhì)網(wǎng)絡(luò)的一部分。網(wǎng)絡(luò)介導(dǎo)細(xì)胞增殖和存活以及遷移和粘附。它們以10種組合二聚化,并且似乎形成高達(dá)150nm的高級(jí)簇,意味著簇內(nèi)數(shù)百個(gè)受體的共定位(abulrob等,jbiolchem285(5):3145-56,2010,通過引用并入本文)。他們識(shí)別和處理多種信號(hào)分子的能力,癌癥過度表達(dá)和藥物靶的上升使其成為無顯微鏡成像(mfi)的有趣和重要的靶(citri和yarden,natrevmolcellbiol.7(7):505-16,2006,通過引用并入本文)。
如本文提供的本公開內(nèi)容的無顯微鏡成像方法揭示了簇蛋白質(zhì)含量和行為的許多方面(圖15)。在靜態(tài)(固定)細(xì)胞中,所有感興趣的蛋白質(zhì)的獨(dú)特標(biāo)記使整個(gè)網(wǎng)絡(luò)內(nèi)容和連接能夠可視化,包括關(guān)聯(lián)化學(xué)計(jì)量學(xué)和細(xì)胞內(nèi)或細(xì)胞間蛋白質(zhì)狀態(tài)的分布。在活細(xì)胞中,mfi方法可以緩慢(例如,數(shù)十到數(shù)百秒)跟隨簇的重新配置,并監(jiān)視更快的過程。如本文提供的從mfi方法獲得的數(shù)據(jù)提供分子尺度分辨率,真實(shí)復(fù)雜網(wǎng)絡(luò)連接性以及跟蹤動(dòng)態(tài)分子相互作用的能力。
對(duì)于一些應(yīng)用,創(chuàng)建了一種基于cnvk的探針(yoshimura等人,org.lett.10(15):3227-3230,2008,引入?yún)⒖?,其可以用312nm光的短脈沖解離。在具有適當(dāng)激光的掃描共焦顯微鏡下識(shí)別感興趣的區(qū)域可以禁用樣品中的所有探針,除了感興趣區(qū)域中的探針,從而允許從原位組織取樣。
此外,對(duì)于某些應(yīng)用,添加帶有“時(shí)間標(biāo)記”的條形碼引物,例如條件a下的時(shí)間標(biāo)記1,隨后是在條件b下帶有時(shí)間標(biāo)記2的隨后的條形碼引物,允許例如藥物遞送后粗略的時(shí)間解析分辨狀態(tài)改變用于藥物篩選應(yīng)用。
實(shí)施例4。
核體組織
在核中兩米dna、ncrna和蛋白質(zhì)的組織被嚴(yán)格控制并具有功能性后果。例如,轉(zhuǎn)錄調(diào)控涉及dna結(jié)合蛋白和可能在相同或不同染色體上分開的lncrna的結(jié)合。染色體構(gòu)象捕獲(3c)方法及其變體已經(jīng)引起了細(xì)胞核中dna的整體結(jié)構(gòu)的興趣,這些染色體構(gòu)象捕獲(3c)方法及其變體產(chǎn)生了從細(xì)胞群體甚至個(gè)體細(xì)胞的染色體間和染色體間相互作用的全基因組圖譜。數(shù)據(jù)顯示,大規(guī)模結(jié)構(gòu)在細(xì)胞之間是可變的,但是小規(guī)模定位是可重復(fù)的,因此相對(duì)重要。目前的方法有幾個(gè)限制:(1)4c方法產(chǎn)生的最高分辨率,在10-20kb,仍然長于伸直dna中核的直徑;(2)低分辨率成對(duì)數(shù)據(jù)不能區(qū)分同源染色體;和(3)它們不能同時(shí)檢測多種蛋白質(zhì)轉(zhuǎn)錄因子,調(diào)控rna和dna的相互作用。
本公開內(nèi)容的無顯微鏡成像(mfi)方法用于闡明核體組織(圖16)。應(yīng)用mfi方法,應(yīng)用oligopaints方法(beliveau等人,pnasusa.109(52):21301-21306,通過引用并入本文),通過原位雜交在每個(gè)靶靶向成千上萬個(gè)任意基因組片段,如本文提供的。由于靶區(qū)不受限制性內(nèi)切酶序列的限制,記錄物反應(yīng)的循環(huán)性質(zhì)允許探針參與許多記錄物對(duì),所以最終圖譜的空間分辨率可以高于由4c提供的千堿基比例分辨率,且遠(yuǎn)遠(yuǎn)高于hi-c。這種同源染色體對(duì)的高分辨率和獨(dú)特標(biāo)記允許在給定基因座處的染色體鑒定。針對(duì)lncrna以及轉(zhuǎn)錄因子、輔因子和染色質(zhì)調(diào)節(jié)因子(通過抗體)的類似探針允許更全面的調(diào)控??梢栽u(píng)估個(gè)體細(xì)胞差異和與表型的相關(guān)性。這些數(shù)據(jù)通過更高的空間分辨率、同源染色體鑒定和平行的高通量蛋白質(zhì)dna或rna-dna相互作用鑒定與3c或顯微鏡方法區(qū)分開。
在一些實(shí)施方案中,使用本公開內(nèi)容的方法來實(shí)現(xiàn)胚胎干(es)或誘導(dǎo)的多能干(ips)細(xì)胞的多能性或分化因子結(jié)合和基因組組織的定位。了解多種轉(zhuǎn)錄因子與干細(xì)胞調(diào)節(jié)的聯(lián)系和共同歸屬使得能夠進(jìn)一步去分化和更完整的靶分化。另外,本公開內(nèi)容的mfi方法允許將未組裝序列映射到基因組。重復(fù)序列或由重復(fù)序列圍繞的那些可能難以定位,但是具有獨(dú)特條形碼的重復(fù)熒光原位雜交(fish)探針,隨后是基于鄰近記錄物的記錄物生成,將在一個(gè)反應(yīng)中難以閱讀的序列連接在一起。
實(shí)施例5
較遠(yuǎn)的分子相互作用
除了近距離地分析分子靶之外,本公開內(nèi)容的mfi可以適于映射由較長距離分離的靶。這種遠(yuǎn)距離數(shù)據(jù)對(duì)于更全面的分子解釋是有用的。在蛋白質(zhì)簇應(yīng)用中,例如,細(xì)胞上的獨(dú)立簇之間的相對(duì)定位可能是重要的,并且如果采用相同的機(jī)制,這些數(shù)據(jù)可以被注冊(cè)到單個(gè)簇測量的相對(duì)定位。此外,染色體位置應(yīng)用可能受益于跨越比直接接觸的那些更遠(yuǎn)的序列的網(wǎng)絡(luò)數(shù)據(jù)的附加網(wǎng)絡(luò)數(shù)據(jù)。這種中間范圍(5-25+nm)采集的機(jī)制依賴于釋放半記錄物的濃度梯度遞減。將短長度引物短暫結(jié)合到現(xiàn)有探針上延伸到半記錄物(圖17)。鏈置換反應(yīng)偶爾將半記錄物解離為僅引物雜交的點(diǎn),然后足夠弱的引物雜交自發(fā)解離,并且半記錄物擴(kuò)散。由于距離很近,遇到結(jié)合的半記錄物或另一個(gè)可溶性記錄物,回文位點(diǎn)相互結(jié)合,并且聚合完整記錄物。在7個(gè)核苷酸的引物長度上發(fā)現(xiàn)合理的引物結(jié)合和自發(fā)解離之間的優(yōu)化平衡(數(shù)據(jù)未顯示)。
實(shí)施例6。
為了表征作為探針間距離的函數(shù)的完整記錄物產(chǎn)生率,將探針對(duì)固定在2ddna納米結(jié)構(gòu)上的編程位置(圖19a)。固定兩種類型作為固有納米結(jié)構(gòu)核酸鏈的延伸,而第三種是通過與中間鏈(插圖)的點(diǎn)擊化學(xué)疊氮基-炔烴連接保持的,以證明探針如何附接到任意部分。兩種方法都將單鏈dna摻入作為柔性接頭。給定納米結(jié)構(gòu)的許多拷貝在云母表面上保持平坦且不可移動(dòng)(如用于dna結(jié)構(gòu)的原子力顯微鏡所做的那樣),并且分別進(jìn)行每個(gè)探針分離距離的記錄反應(yīng)。然后通過pcr擴(kuò)增記錄物,并通過凝膠電泳定量產(chǎn)物。為了考慮實(shí)驗(yàn)條件的變化,特別是在納米結(jié)構(gòu)數(shù)量上,在每個(gè)納米結(jié)構(gòu)類型上存在具有正交pcr序列的第二探針對(duì),但總是處于相同的固定分離距離。相對(duì)于該參考對(duì)計(jì)算生產(chǎn)率。
圖19b表示三個(gè)探針設(shè)計(jì)的相對(duì)記錄速率,包含0、12和18nt個(gè)間隔子結(jié)構(gòu)域。對(duì)于6至48nm的間隔,每6nm測試一個(gè)探針對(duì),記錄物發(fā)生率數(shù)學(xué)擬合歸一化至共同的最大值。零,12和18nt探針均以最接近最大速率生成記錄物,表明局部濃度效應(yīng)是速率的主要驅(qū)動(dòng)力。速率分別在13、20和25nm處降低了一半,在18、42和48nm處具有最大距離(接近零速率)。絕對(duì)地說,12nt間隔探針以最快的速度產(chǎn)生記錄物,大約是0和18nt探針的兩倍(未顯示)。當(dāng)dna探針和附加的半記錄物如在直鏈中以最佳方式取向時(shí),所有三個(gè)最大距離與預(yù)期值一致。對(duì)于0nt間隔探針,最大預(yù)期距離是探針長度(雙鏈dna的19nt,每堿基對(duì)0.34nm,13至6.5nm)和半記錄物長度(單鏈dna的11nt減去3nt回文重疊,每個(gè)堿基最大0.58nm,13至4.6nm)的總和的兩倍,總共至22nm(如圖2c中的幾何結(jié)構(gòu),步驟ii之后)。類似地,12nt和18nt間隔探針分別具有約36和約43nm的最大預(yù)期距離。使用蠕蟲狀鏈模型的估計(jì)是相似的。
使用最長的探針(具有18nt的間隔子)來測試apr確定三個(gè)靶的相對(duì)位置的能力。三個(gè)這樣的探針,其編程不同的引物序列,因此產(chǎn)生具有獨(dú)特端的記錄物,再次通過2d納米結(jié)構(gòu)在具有30nm探針分離的四種構(gòu)型中的每一種中固定(圖19c)。當(dāng)放置在三角形配置(圖19c,圖(i))中,其中每個(gè)探針彼此等距時(shí),在凝膠上產(chǎn)生并顯著地看到所有三個(gè)記錄物,指示每對(duì)的緊密接近,因此三角形布置。然而,當(dāng)放置在鄰近探針在距離范圍內(nèi)但遠(yuǎn)距離的探針不在的線中時(shí),只有鄰近探針的產(chǎn)物是突出的。線性布置的三個(gè)可能的順序各自產(chǎn)生適當(dāng)?shù)挠涗浳?圖19c,圖(ii)-(iv)),證明了在任意配置中記錄物來自三個(gè)分子尺度靶的幾何信息的能力。該方法可以簡單地通過設(shè)計(jì)正交引物序列的其他探針來應(yīng)用于三個(gè)以上的同時(shí)靶。
實(shí)施例7。
除了識(shí)別下分子組織之外,還展示了改變系統(tǒng)的重新抽樣。圖3的探針的相同的納米結(jié)構(gòu),三角形布置。在圖19c(i)中,構(gòu)建了用于使探針p3失活的機(jī)構(gòu)(圖20a)。在每個(gè)采樣點(diǎn),上清液進(jìn)行pcr擴(kuò)增,并通過變性page進(jìn)行觀察。首先,對(duì)三角形布置進(jìn)行記錄物和采樣,表明如預(yù)期的三個(gè)探針共定位(圖20b,圖(i))。用緩沖液洗滌后,對(duì)上清液進(jìn)行取樣,不表示殘留記錄物(圖20b,圖(ii))。然后,通過將不可延伸的p3封閉引物z*-u*(3'末端的反向dt)施加到系統(tǒng),剩余p3引物u*和半記錄物被置換,并且該探針不能進(jìn)一步結(jié)合引物,使其失活。洗滌,記錄物和重新取樣僅指示兩個(gè)下部探針的共定位(圖20b,圖(iii))。
等同物
雖然本文已經(jīng)描述和顯示了幾個(gè)發(fā)明實(shí)施例,但是本領(lǐng)域普通技術(shù)人員將容易地想出用于執(zhí)行功能和/或獲得結(jié)果的各種其他手段和/或結(jié)構(gòu)和/或所描述的一個(gè)或多個(gè)優(yōu)點(diǎn)并且這些變化和/或修改中的每一個(gè)被認(rèn)為在本文所描述的發(fā)明實(shí)施例的范圍內(nèi)。更一般來說,本領(lǐng)域技術(shù)人員將容易地理解,本文所述的所有參數(shù),尺寸,材料和構(gòu)造意在是示例性的,并且實(shí)際參數(shù),尺寸,材料和/或構(gòu)造將取決于具體應(yīng)用或應(yīng)用使用本發(fā)明的教導(dǎo)。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到或能夠使用不超過常規(guī)實(shí)驗(yàn)來確定本文所述的具體創(chuàng)造性實(shí)施例的許多等同物。因此,應(yīng)當(dāng)理解,前述實(shí)施例僅以示例的方式呈現(xiàn),并且在所附權(quán)利要求及其等同物的范圍內(nèi),除了具體描述和要求保護(hù)之外,發(fā)明實(shí)施例可以被實(shí)施。本公開內(nèi)容的發(fā)明實(shí)施例涉及本文所述的每個(gè)單獨(dú)特征,系統(tǒng),制品,材料,試劑盒和/或方法。此外,如果這些特征,系統(tǒng),物品,材料,試劑盒和/或方法不相互矛盾,則兩個(gè)或更多個(gè)這樣的特征,系統(tǒng),制品,材料,試劑盒和/或方法的任何組合都包括在本發(fā)明的發(fā)明范圍。
應(yīng)理解為在本文中定義和使用的所有定義,以控制字典定義,通過引用并入的文獻(xiàn)中的定義和/或定義術(shù)語的普通含義。
本文中公開的所有參考文獻(xiàn),專利和專利申請(qǐng)均通過引用并入本文,涉及每個(gè)被引用的主題,在某些情況下可涵蓋該文獻(xiàn)的整體。
在本說明書和權(quán)利要求中使用的不定冠詞“a”和“an”除非明確指出相反,應(yīng)理解為“至少一個(gè)”。
在本說明書和權(quán)利要求書中使用的短語“和/或”應(yīng)當(dāng)理解為是指所結(jié)合的元件中的“一個(gè)或兩個(gè)”,即在某些情況下結(jié)合存在的元件并且在另一個(gè)中分離存在的元件案例。以“和/或”列出的多個(gè)元素應(yīng)以相同的方式來解釋,即所謂的“一個(gè)或多個(gè)”元素的結(jié)合。可以可選地存在除“和/或”子句特別標(biāo)識(shí)的元素之外的其它元素,無論是與特定識(shí)別的那些元素相關(guān)或不相關(guān)。
如本說明書和權(quán)利要求書中所使用的,短語“至少一個(gè)”對(duì)于一個(gè)或多個(gè)元素的列表應(yīng)當(dāng)被理解為是指從至少一個(gè)元素中選出的至少一個(gè)元素元素列表,但不一定包括元素列表中具體列出的每個(gè)元素中的至少一個(gè)元素,而不排除元素列表中元素的任何組合。該定義還允許除了在短語“至少一個(gè)”所指的元素列表中具體識(shí)別的元素之外,可以可選地存在這些元素,無論與特定識(shí)別的元素相關(guān)或不相關(guān)。
還應(yīng)當(dāng)理解,除非明確地指出相反,在本文要求保護(hù)的包括多于一個(gè)步驟或作用的任何方法中,方法的步驟或動(dòng)作的順序不一定限于步驟或步驟列舉了該方法的作用。
在權(quán)利要求書中以及上述說明書中,所有過渡性短語如“包含”,“包括”,“攜帶”,“具有”,“包含”,“涉及”,“持有”將被理解為是開放式的,即意味著包括但不限于此。只有“由...組成”和“基本上由...組成”的過渡性短語分別是“美國專利局專利審查程序手冊(cè)”第2111.03節(jié)中所規(guī)定的封閉或半封閉的過渡性短語。
序列表
<110>presidentandfellowsofharvardcollege
<120>無顯微鏡成像
<130>h0498.70529wo00
<140>notyetassigned
<141>2016-01-29
<150>us62/110,050
<151>2015-01-30
<160>7
<170>patentinversion3.5
<210>1
<211>74
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<400>1
agtcagctcgagctaggtctagagctaggctatcactagtgatagcctagctctagacct60
agctcgagctactt74
<210>2
<211>74
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<400>2
agtcagctcgagctaggtcttagcgtaggctacaactagtgctagctagcgagcagacct60
agctcgagctactt74
<210>3
<211>74
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<400>3
agtcagctcgagctaggtctagcgctatctagctactagtatcgtactgtgacgagacct60
agctcgagctactt74
<210>4
<211>74
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<400>4
agtcagctcgagctaggtctgatctagcgtagccactagtaggctctagcgactagacct60
agctcgagctactt74
<210>5
<211>74
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<400>5
agtcagctcgagctaggtctaggctctagctagcactagtcgatagctagcgaaagacct60
agctcgagctactt74
<210>6
<211>79
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<220>
<221>misc_feature
<222>(7)..(7)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(11)..(11)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(18)..(18)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(22)..(22)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(28)..(49)
<223>nisa,c,ort
<220>
<221>misc_feature
<222>(65)..(65)
<223>t用生物素修飾
<220>
<221>misc_feature
<222>(73)..(74)
<223>用間隔子9修飾
<400>6
aaaaaancatncccagcntacnctcacnnnnnnnnnnnnnnnnnnnnnnaccggttcgct60
ggtttttccagcgaccggt79
<210>7
<211>16
<212>dna
<213>人工序列
<220>
<223>合成的多核苷酸
<220>
<221>misc_feature
<222>(1)..(1)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(5)..(5)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(12)..(12)
<223>n是脫氧尿苷
<220>
<221>misc_feature
<222>(16)..(16)
<223>n是脫氧尿苷
<400>7
ncatncccagcntacn16