Msp納米微孔和相關(guān)方法
【專利說明】MSP納米微孔和相關(guān)方法
[0001] 本申請是申請日為2009年9月22日、發(fā)明名稱為"MSP納米微孔和相關(guān)方法"的 中國發(fā)明專利申請200980142855. 5的分案申請。
[0002] 交叉參考相關(guān)申請
[0003] 本申請要求2008年9月22日提交的美國臨時(shí)申請系列案61/098, 938的權(quán)益,所 述臨時(shí)申請系列案以其全文通過引用合并入本文。
[0004] 政府許可權(quán)利的聲明
[0005] 本發(fā)明是利用在由國立衛(wèi)生研宄院授予的基金號5R21HG004145下的政府資助進(jìn) 行的。政府在本發(fā)明中具有某些權(quán)利。
[0006] 背景
[0007] 已建立的DNA測序技術(shù)需要大量DNA和若干冗長的步驟來僅構(gòu)建全長序列的數(shù)十 個(gè)堿基。然后必須以"鳥槍法"方式(非線性地依賴于基因組的大小和依賴于從其構(gòu)建全 長基因組的片段的長度的工作)裝配該信息。這些步驟很昂貴且費(fèi)時(shí),尤其當(dāng)測定哺乳動(dòng) 物基因組的序列時(shí)。
[0008] 概述
[0009] 本文中提供了包括對具有界定通道(tunnel)的前廳(vestibule)和纟益縮區(qū) (constrictionzone)的恥垢分枝桿菌(Mycobacteriumsmegmatis)孔蛋白(Msp)孔蛋白 施加電場的方法,其中Msp孔蛋白位于第一導(dǎo)電液體介質(zhì)與第二導(dǎo)電液體介質(zhì)之間。
[0010] 還提供了改進(jìn)通過Msp孔蛋白的通道(tunnel)的電導(dǎo)的方法,包括除去、添加或 置換野生型Msp孔蛋白的前廳或縊縮區(qū)中的至少一個(gè)氨基酸。
[0011] 還提供了包括具有界定通道的前廳和縊縮區(qū)的Msp孔蛋白的系統(tǒng),其中所述通道 位于第一液體介質(zhì)與第二液體介質(zhì)之間,其中至少一種液體介質(zhì)包含分析物,以及其中系 統(tǒng)對于檢測分析物的性質(zhì)是有效的。
[0012] 還提供了包括具有界定通道的前廳和縊縮區(qū)的Msp孔蛋白的系統(tǒng),其中所述通道 位于第一液體介質(zhì)與第二液體介質(zhì)之間的脂雙層中,并且其中第一與第二液體介質(zhì)之間的 液體連通的唯一點(diǎn)存在于通道中。
[0013]還提供了突變的Msp孔蛋白。例如,提供了突變的恥垢分枝桿菌孔蛋白A(MspA), 其包含界定通道的前廳和縊縮區(qū),以及至少第一突變MspA單體,所述單體包含位置93上的 突變和位置90、位置91或位置90及91上的突變。還提供了突變的MspA孔蛋白,其包含 具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和 約0. 3至約3nm的直徑的縊縮區(qū),其中所述前廳和縊縮區(qū)一起界定了通道,以及還包含至少 第一突變MspA旁系同源物或(paralog)同系物(homolog)單體。還提供了突變MspA旁系 同源物或同系物,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約 0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區(qū),其中所述前廳和縊縮區(qū)一起界定了 通道。
[0014] 描述了產(chǎn)生突變的Msp孔蛋白的方法。例如,本文中提供了產(chǎn)生突變的MspA孔蛋 白的方法,包括在位置93上和位置90、位置91或位置90及91上修飾野生型MspA單體。 還提供了產(chǎn)生具有界定了通道的前廳和縊縮區(qū)的突變MspA孔蛋白的方法,包括在野生型MspA旁系同源物或同系物單體的前廳或縊縮區(qū)中缺失、添加或置換任何氨基酸以便所得的 突變MspA孔蛋白能夠在施加電場后將分析物轉(zhuǎn)位通過通道。
[0015] 還提供了一種方法,所述方法包括在不使用電場的情況下使分析物轉(zhuǎn)位通過恥垢 分枝桿菌孔蛋白(Msp)孔蛋白的通道。
[0016] 本文中提供了核酸序列。任選地,核酸序列可包含第一和第二核苷酸序列,其中所 述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二Msp單體序列。該 核酸序列還可包含編碼氨基酸連接體序列的第三核苷酸序列。任選地,該核酸序列還包含 編碼第三或更多Msp單體序列的第三或更多核苷酸序列。例如,所述核酸序列還可包含第 3、第4、第5、第6、第7和第8核苷酸序列。所述第1、第2、第3、第4、第5、第6、第7和第8 核苷酸序列編碼第1、第2、第3、第4、第5、第6、第7和第8Msp單體序列,并且該核酸序列 還包含編碼氨基酸連接體序列的第9核苷酸序列。還提供了包含兩個(gè)或更多個(gè)單鏈Msp的 Msp孔蛋白。
[0017] 還提供了由本文中所述的核酸編碼的多肽。還提供了包含本文中描述的多肽的載 體。還提供了用本文中描述的任何載體轉(zhuǎn)染的培養(yǎng)細(xì)胞或其后代,其中所述細(xì)胞能夠表達(dá)Msp孔蛋白或Msp孔蛋白單體。還提供了包含本文中描述的任何載體的恥垢分枝桿菌菌株。
[0018] 還提供了能夠誘導(dǎo)Msp單體表達(dá)的突變的細(xì)菌菌株,所述細(xì)菌菌株包含:(a)野生 型MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和⑷包含有效地連接 于Msp單體核酸序列的誘導(dǎo)型啟動(dòng)子的載體。
[0019] 還提供了產(chǎn)生單鏈Msp孔蛋白的方法,所述方法包括:(a)用包含能夠編碼單鏈 Msp孔蛋白的核酸序列的載體轉(zhuǎn)化突變的細(xì)菌菌株;和任選地(b)從所述細(xì)菌純化單鏈Msp 孔蛋白。該突變的菌株可包含野生型MspA、野生型MspB、野生型MspC和野生型MspD的缺 失,以及包含有效地連接于Msp核酸序列的誘導(dǎo)型啟動(dòng)子的載體??捎冒軌蚓幋a單鏈 Msp孔蛋白的核酸序列的載體轉(zhuǎn)化該突變的菌株。
[0020] 還提供了使用Mps孔蛋白例如單鏈Msp孔蛋白的方法。例如,所述方法可包括產(chǎn) 生具有第一側(cè)面和第二側(cè)面的脂雙層,向脂雙層的第一側(cè)面加入Msp孔蛋白例如純化的單 鏈Msp孔蛋白,對雙分子層的第二側(cè)面施加正電位,使實(shí)驗(yàn)性核酸序列或多肽序列轉(zhuǎn)位通 過Msp孔蛋白,測量使序列轉(zhuǎn)位通過Msp孔蛋白的阻塞電流,以及將該實(shí)驗(yàn)性阻塞電流與阻 塞電流標(biāo)準(zhǔn)相比較,確定該實(shí)驗(yàn)性序列。
[0021] 附圖概述
[0022] 上述方面和許多附帶的有利方面將變得更容易理解,因?yàn)楫?dāng)與下列附圖結(jié)合,參 考下列詳述,上述方面和許多附帶的有利方面可得到更好地理解。
[0023] 圖1顯示野生型MspA(WTMspA)孔蛋白的結(jié)構(gòu)和電荷分布。在pH 8時(shí),預(yù)期酸性 殘基主要帶負(fù)電荷并且堿性殘基主要帶正電荷。突變的位置和殘基由箭頭和標(biāo)記指示。參 見Faller等人,Science,303:1189 (2004)〇
[0024]圖 2 顯示W(wǎng)TMspA、突變體D90N/D91N/D93N(MlMspA,也稱為M1-NNN)和突變體 D90N/D91N/D93N/D118R/E139K/D134R(M2MspA,也稱為M2-NNN)孔蛋白的通道形成活性和 單通道電導(dǎo)的測定結(jié)果。左圖顯示當(dāng)MspA孔蛋白存在于水浴雙分子層的溶液(1MKC1, 20°C)中時(shí),雙分子層的電導(dǎo)隨時(shí)間的變化。電導(dǎo)的逐步增加被解釋為MspA孔蛋白至雙 分子層內(nèi)的插入。右邊是這些電導(dǎo)步長(conductancestep)的大小的直方圖。WTMspA、MIMspA和M2MspA孔蛋白的直方圖分別概括了來自3個(gè)重復(fù)實(shí)驗(yàn)的40個(gè)插入、來自3個(gè)重 復(fù)實(shí)驗(yàn)的144個(gè)插入和來自5個(gè)重復(fù)實(shí)驗(yàn)的169個(gè)插入。
[0025] 圖3A和3B顯示了WTMspA孔蛋白的自發(fā)阻塞行為。圖3A是實(shí)驗(yàn)的示意圖。圖3B 顯示在DNA不存在的情況下在60mV(左)和100mV(右)下對于WTMspA孔蛋白觀察到的代 表性離子電流信號。負(fù)電流的間隔時(shí)間相應(yīng)于施加的電壓的反轉(zhuǎn),這通常是重建未被阻塞 的離子電流水平所需的。
[0026] 圖4顯示電泳凝膠中突變的MspA單體的表達(dá)。向各泳道中加入粗制提取物 (13yL)。用考馬斯藍(lán)染色凝膠。泳道1:蛋白質(zhì)分子量標(biāo)準(zhǔn);泳道2:WTMspA;泳道3:無 MspA;泳道4:突變體MIMspA;泳道5:突變體D90N/D91N/D93N/D118R;泳道6:突變體D90N/ D91N/D93N/D118R/E139R;泳道 7:突變體D90N/D91N/D93N/D118R/E139K;泳道 8:突變體 M2MspA。構(gòu)建、提取和測定泳道5至7中的突變體以確保對于每一個(gè)連續(xù)氨基酸置換保持 表達(dá)和通道形成活性。凝膠上方的簡圖示意性顯示在該實(shí)驗(yàn)中突變的氨基酸的大致位置和 極性。
[0027] 圖5A-5C顯示利用MIMspA孔蛋白進(jìn)行的ssDNA發(fā)夾構(gòu)建體的檢測。圖5A是實(shí)驗(yàn) 的示意圖。圖5B顯示在180和140mV下在DNA不存在和在8yMhp08(SEQIDN0:4)發(fā)夾 DNA存在的情況下對于MIMspA孔蛋白觀察到的代表性離子電流信號。圖5C顯示在放大的 時(shí)標(biāo)(expandedtimescale)上來自圖5B中的描記線的已編號的阻塞。
[0028] 圖6顯示MIMspA孔蛋白中來自發(fā)夾構(gòu)建體的深度阻塞的特征。每一個(gè)點(diǎn) 的坐標(biāo)給出了 1個(gè)深度阻塞的持續(xù)時(shí)間和平均電流。分別在140和180mV獲得黑色 和灰色數(shù)據(jù)。對于每一個(gè)數(shù)據(jù)集,標(biāo)出深度阻塞駐留時(shí)間tD的loglO模式。右邊的 簡圖顯示每一個(gè)發(fā)夾構(gòu)建體的序列:hp08CGCTGTTGCTCTCTCGCAACAGCA503r ) (SEQIDN0:4)、hpl0(5 'GCTCTGTTGCTCTCTCGCAACAGAGCA5(l3 ' )(SEQIDNO:5)和 hpl2(5'GCTGTCTGTTGCTCTCTCGCAACAGACAGCA5(l-3,)(SEQIDNO:6)。
[0029] 圖7是顯示MIMspA孔蛋白中針對hp08(SEQIDN0:4)的部分阻塞駐留時(shí)間分布 的圖。分布十分?jǐn)M合單指數(shù)模式。在180mV下的部分阻塞具有約比在140mV上長3倍的時(shí) 間常數(shù)。
[0030] 圖8提供了MIMspA孔蛋白中發(fā)夾構(gòu)建體深度阻塞的駐留時(shí)間分布的詳細(xì)外觀。 左邊的圖框顯示具有駐留時(shí)間(x)的loglO的概率分布的對數(shù)二進(jìn)制圖(階梯圖)和相應(yīng) 核平滑密度估計(jì)的駐留時(shí)間直方圖。將這些平滑的密度估計(jì)值的最大值tD用于參數(shù)化駐 留時(shí)間分布。垂直線顯示tD值。右邊的圖框顯示來源于駐留時(shí)間數(shù)據(jù)(實(shí)線)和單衰減 指數(shù)(singledecayingexponential)的存活概率曲線,時(shí)間常數(shù)設(shè)置為每一個(gè)數(shù)據(jù)組的 tD值(虛線)。數(shù)據(jù)明顯偏離單指數(shù)變動(dòng)形態(tài)(simpleexponentialbehavior)。然而, 進(jìn)行tD值與用于其他觀察的指數(shù)時(shí)間常數(shù)之間的定性比較是合理的(Kasianowicz等人, Proc.NatlAcad.Sci.USA,93:13770(1996)),因?yàn)檫@兩個(gè)參數(shù)均反映了駐留時(shí)間分布的相 似方面。
[0031] 圖9A-9G顯示獲自跨雙層探針實(shí)驗(yàn)(transbilayerprobeexperiment)的數(shù)據(jù)。 圖9A顯示分子構(gòu)型的動(dòng)畫(animation) : (1)未被阻塞的孔;(2)具有阻止nA-ssDNA復(fù)合 物轉(zhuǎn)位的neutravidin(nA)的絲狀ssDNA; (3)與nA-ssDNA雜交的革EDNA在負(fù)電壓下分離; 和⑷nA-ssDNA復(fù)合物在某一電壓下(依賴于靶DNA的雜交)從孔排出。圖9B是外施電 壓的時(shí)間序列。電流阻塞在約200ms的延遲后觸發(fā)從180mV捕捉電壓至40mV的維持電壓的 變化。維持電壓維持5秒以允許雜交,然后向負(fù)電壓下降。圖9C和9D各自顯示表明nA-ssDNA分別在負(fù)和正電壓下排出的電流時(shí)間序列。由于瞬間電壓改變和在大的負(fù)電壓下自 發(fā)的孔關(guān)閉,大電流尖脈沖產(chǎn)生。圖9E-9G是排出電壓(exitvoltage) (Vexit)直方圖。 圖9E顯示一個(gè)實(shí)驗(yàn),在該實(shí)驗(yàn)中,探針5'-C6A54-CTCTAITCTTATCTC-3'(SEQIDN0:7)與靶 ssDNA分子 5' -GAGATAAGAATAGAG-3'(SEQIDN0:9)互補(bǔ)。圖 9F顯示與圖 9E中相同的孔, 但其使用不與靶0嫩互補(bǔ)的探針5'-(^54-04040404040404〇3'(5£0 10吣:8)。圖96顯示 來自使用與圖9E中的探針相同的探針(SEQIDN0:7)但在反面區(qū)室(transcompartment) 中不存在靶DNA的單獨(dú)的對照的結(jié)果。只在圖9E中觀察到大量負(fù)Vexit事件,其中探針 (SEQIDN0:7)與靶互補(bǔ)。圖9F和9G中負(fù)Vexit事