本發(fā)明涉及單元DNA組合物的制備方法及DNA連結(jié)體的制作方法。
背景技術(shù):
近年來,對以構(gòu)建基因組水平的長鏈DNA等為目的的DNA合成技術(shù)的開發(fā)正日益盛行。作為DNA的合成技術(shù),將通過化學(xué)合成DNA、PCR法擴(kuò)增得到的單元DNA組裝起來的技術(shù)是已知的。但是,已知在化學(xué)合成DNA的合成過程和PCR法中突變被隨機(jī)地導(dǎo)入合成的DNA中。因此,在基因的組裝中,在直到最后一個階段為止的所有階段都必須要進(jìn)行對DNA的序列加以確認(rèn)、以及選擇具有期望的序列的DNA的過程。
為了對堿基序列進(jìn)行確認(rèn),通常通過利用雙脫氧鏈終止法(Sanger法)的自動熒光測序儀來進(jìn)行堿基序列測定,采用該方法能夠在1次堿基序列測定中對連續(xù)長度為800堿基左右的堿基序列加以確認(rèn)。在基因組裝前要對利用化學(xué)合成、PCR法合成的單元DNA堿基序列進(jìn)行確認(rèn)的情況下,如果堿基序列測定的次數(shù)少,則可以削減時間、費用的成本。因此,對用于基因組裝的利用化學(xué)合成、PCR法合成的單元DNA而言,短是優(yōu)選的。
然而,如果用于基因組裝的單元DNA短,則需要組裝很多個單元DNA。
目前,作為將多個單元DNA組裝起來的方法之一,已知有利用了枯草芽孢桿菌(Bacillus subtilis)的質(zhì)粒轉(zhuǎn)化體系的基因組裝法(OGAB法)。例如,專利文獻(xiàn)1中公開了使用了OGAB法的枯草芽孢桿菌細(xì)胞轉(zhuǎn)化用質(zhì)粒DNA的制作方法。
OGAB法中,使用了通過在質(zhì)粒分子間進(jìn)行同源重組從而在1個DNA分子中存在多個質(zhì)粒單元的所謂多聚體質(zhì)粒(multimer plasmid)。采用OGAB法時,轉(zhuǎn)化用的DNA分子不需要是環(huán)狀DNA,只要形成為質(zhì)粒的1個單元和用于組裝的各個單元DNA得以在同一方向上重復(fù)出現(xiàn)的串聯(lián)重復(fù)狀(tandem repeats),就可能實現(xiàn)質(zhì)粒的轉(zhuǎn)化。
OGAB法中,如上所述,需要制備連接(ligation)為串聯(lián)重復(fù)狀的DNA分子,因此,使用多個單元DNA時,需要將這些單元DNA和質(zhì)粒連結(jié)。但是,單元DNA的種類越多,越難以將這些單元DNA連結(jié)并制作串聯(lián)重復(fù),為了使數(shù)量較多的單元DNA連結(jié),連接時的各單元DNA的摩爾比接近于1是令人期望的。
現(xiàn)有技術(shù)文獻(xiàn)
專利文獻(xiàn)
專利文獻(xiàn)1:日本專利第4479199號公報
技術(shù)實現(xiàn)要素:
然而,實際情況中,難以精密地控制各單元DNA的摩爾數(shù)。其一個原因在于,在利用SYBRGeenI等熒光性雙鏈DNA嵌入劑的DNA測定法中,由于測定時的熒光物質(zhì)消光等,導(dǎo)致僅能以±20%左右的重現(xiàn)性來測定分子數(shù)。另外,這些測定方法中,測定的是DNA的每單位體積的重量,而在OGAB法中,要以每單位體積的摩爾數(shù)為基準(zhǔn)來算出單元DNA量,所以,需要將利用上述測定方法得到的DNA重量測定值變換為摩爾濃度。因此,單元DNA分子的長度分布較廣時,即使是摩爾數(shù)相同的DNA分子,因為重量與單元DNA的長度成比例,尤其是重量的測定值相差數(shù)倍以上時,基于測定值算出的值常含有大的誤差。在上述專利文獻(xiàn)1的方法中,雖然嘗試將各單元DNA的摩爾比調(diào)整為1,但由于各單元DNA的長度的分布廣,無法精密地控制摩爾比。
本發(fā)明是鑒于上述實際情況而做出的,本發(fā)明的目的在于提供多個單元DNA的摩爾數(shù)更加一致的單元DNA組合物的制備方法及DNA連結(jié)體的制作方法。
本申請的發(fā)明人發(fā)現(xiàn),在向各單元DNA分別連結(jié)了附加序列的狀態(tài)下對單元DNA的摩爾數(shù)加以測定,由此使得測定結(jié)果的誤差變小,從而完成了本發(fā)明。更具體而言,本發(fā)明提供以下內(nèi)容。
(1)單元DNA組合物的制備方法,所述方法包括下述工序:
針對連結(jié)有附加序列的多個單元DNA,準(zhǔn)備分別含有其中的每一種所述單元DNA的溶液的工序;和
在準(zhǔn)備所述各溶液后,在所述單元DNA連結(jié)有附加序列的狀態(tài)下,測定所述各溶液中的單元DNA的濃度,基于其結(jié)果分取所述各溶液,使各溶液中的單元DNA的摩爾數(shù)接近于彼此相同的工序。
(2)如(1)所述的單元DNA組合物的制備方法,其中,所述連結(jié)有附加序列的單元DNA具有環(huán)狀結(jié)構(gòu),所述附加序列為具有復(fù)制起點的質(zhì)粒DNA序列。
(3)如(1)或(2)所述的單元DNA組合物的制備方法,其中,所述單元DNA各自的堿基長度和與各單元DNA連結(jié)的附加序列的堿基長度的合計總長度的分布的標(biāo)準(zhǔn)偏差為相對于所述總長度平均值而言±20%以內(nèi)。
(4)如(1)至(3)中任一項所述的單元DNA組合物的制備方法,其中,與所述各單元DNA連結(jié)的附加序列的平均堿基長度為所述單元DNA的平均堿基長度的2倍以上。
(5)如(1)至(4)中任一項所述的單元DNA組合物的制備方法,其中,所述單元DNA各自的長度為1600bp以下。
(6)如(1)至(5)中任一項所述的單元DNA組合物的制備方法,所述單元DNA用于制作含有由該單元DNA構(gòu)成的組裝DNA的DNA連結(jié)體,
所述方法中,準(zhǔn)備含有所述單元DNA的溶液的工序包括以下工序:以所述組裝DNA中下述位置的序列附近的非回文序列為界,設(shè)計在端部具有非回文序列的所述單元DNA,所述位置是以用所述組裝DNA的序列的堿基長度除以所述單元DNA的種類數(shù)時各段堿基長度相等的方式將所述組裝DNA等分時的位置。
(7)一種DNA連結(jié)體的制作方法,所述DNA連結(jié)體是用于微生物細(xì)胞轉(zhuǎn)化的DNA連結(jié)體,所述用于微生物細(xì)胞轉(zhuǎn)化的DNA連結(jié)體含有大于1個的下述組裝DNA單元,所述組裝DNA單元含有載體DNA和組裝DNA,所述載體DNA包含在宿主微生物中有效的復(fù)制起點,所述方法包括下述工序:
利用權(quán)利要求1至6中任一項所述的方法制備單元DNA組合物的工序;
準(zhǔn)備所述載體DNA的工序;
使用限制性內(nèi)切酶、從制備得到的所述溶液中連結(jié)有附加序列的單元DNA中除去各自的附加序列的工序;和
在所述除去工序后,將所述載體DNA及所述各單元DNA彼此連結(jié)的工序,
其中,所述載體DNA及所述各單元DNA具有能夠以彼此保持順序的狀態(tài)重復(fù)連結(jié)的結(jié)構(gòu),
所述組裝DNA包含所述各單元DNA彼此連結(jié)而成的DNA。
(8)如(7)所述的DNA連結(jié)體的制作方法,所述方法包括:基于目標(biāo)連結(jié)數(shù)的DNA片段的收率與所述DNA片段的濃度的變動系數(shù)之間的關(guān)系式,對所述連結(jié)工序中的所述載體DNA及所述各單元DNA的濃度的變動系數(shù)加以調(diào)節(jié)的工序,所述目標(biāo)連結(jié)數(shù)由構(gòu)成組裝單元的單元DNA的數(shù)量和組裝單元的數(shù)量的乘積表示。
(9)如(7)或(8)所述的DNA連結(jié)體的制作方法,其中,所述限制性內(nèi)切酶為II型限制性內(nèi)切酶。
(10)如(7)至(9)中任一項所述的DNA連結(jié)體的制作方法,其中,在所述除去工序前還具有將制備得到的含有單元DNA的溶液中的2種以上的含有單元DNA的溶液混合的工序。
(11)如(7)至(10)中任一項所述的DNA連結(jié)體的制作方法,其中,在所述除去工序后、所述連結(jié)工序前還具有使所述限制性內(nèi)切酶失活的工序。
(12)如(7)至(11)中任一項所述的DNA連結(jié)體的制作方法,其中,所述微生物為枯草芽孢桿菌。
根據(jù)本發(fā)明,可以提供多個單元DNA的摩爾數(shù)更加一致的單元DNA組合物的制備方法及DNA連結(jié)體的制作方法。
附圖說明
圖1是表示本發(fā)明的一個實施例涉及的載體DNA的圖。
圖2是表示本發(fā)明實施例1中的單元DNA中第10片段的同義密碼子突變體的結(jié)構(gòu)的圖。
圖3顯示了本發(fā)明實施例1中含有單元DNA中第01片段或第21片段的粗提取質(zhì)粒、和將該粗提取質(zhì)粒純化后得到的高純度質(zhì)粒用限制性內(nèi)切酶處理后的電泳照片。
圖4顯示了本發(fā)明實施例1中針對純化后的含有單元DNA的質(zhì)粒中將用BbsI處理的組、將用AarI處理的組、將用BsmBI處理的組,以各種限制性內(nèi)切酶進(jìn)行全部處理后的電泳照片。
圖5顯示了針對本發(fā)明實施例1中純化后的含有單元DNA的質(zhì)粒中將用BbsI處理的組、將用AarI處理的組、將用BsmBI處理的組,以各種限制性內(nèi)切酶進(jìn)行限制性內(nèi)切酶進(jìn)行全部處理并將各組整合后的電泳照片。
圖6是顯示針對本發(fā)明實施例1中的含有單元DNA的質(zhì)粒中將用BbsI處理的組、將用AarI處理的組、將用BsmBI處理的組,以各種限制性內(nèi)切酶進(jìn)行全部處理并將各組整合后,在尺寸分級分離(size fractionation)之前和之后的各個單元DNA的分子數(shù)分布的圖。
圖7是顯示針對本發(fā)明實施例1中的含有單元DNA的質(zhì)粒中將用BbsI處理的組、將用AarI處理的組、將用BsmBI處理的組,以各種限制性內(nèi)切酶進(jìn)行全部處理并將各組整合后,在尺寸分級分離之前和之后的各個單元DNA的分子數(shù)的變化率的圖。
圖8顯示了本發(fā)明實施例1中、將單元DNA和載體DNA連接后的電泳的照片。
圖9顯示了本發(fā)明實施例1中、將單元DNA和載體DNA連接得到的DNA連結(jié)體轉(zhuǎn)化至枯草芽孢桿菌中后,從該轉(zhuǎn)化后的多個枯草芽孢桿菌中提取質(zhì)粒,并將該質(zhì)粒用限制性內(nèi)切酶處理后的電泳的照片。
圖10顯示了本發(fā)明實施例1中、基于從轉(zhuǎn)化后的多個枯草芽孢桿菌中提取質(zhì)粒并將該質(zhì)粒用限制性內(nèi)切酶處理后的電泳的照片的結(jié)果來篩選含有目標(biāo)組裝DNA的枯草芽孢桿菌的克隆、并進(jìn)行了限制性內(nèi)切酶處理后的電泳的照片。
圖11是表示本發(fā)明實施例1中、篩選出的組裝DNA形成了λ噬菌體DNA的噬斑(plaque)的圖。
圖12顯示了本發(fā)明實施例1中、將篩選出的組裝DNA的基因組和野生型λ噬菌體用AvaI實施限制性內(nèi)切酶處理后的照片。
圖13顯示了本發(fā)明實施例2中、用AarI實施限制性內(nèi)切酶對純化后的含有單元DNA的質(zhì)粒進(jìn)行全部處理后的電泳的照片。
圖14顯示了本發(fā)明實施例2中、單元DNA和載體DNA連接后的電泳的照片。
圖15顯示了本發(fā)明實施例2中、在將單元DNA和載體DNA連接后的DNA連結(jié)體轉(zhuǎn)化至枯草芽孢桿菌中后,從該轉(zhuǎn)化后的多個枯草芽孢桿菌中提取質(zhì)粒,并將該質(zhì)粒用限制性內(nèi)切酶處理后的電泳的照片。
圖16顯示了本發(fā)明實施例2中、基于從轉(zhuǎn)化后的多個枯草芽孢桿菌中提取質(zhì)粒并將該質(zhì)粒用限制性內(nèi)切酶處理后的電泳的照片的結(jié)果來篩選含有目標(biāo)組裝DNA的枯草芽孢桿菌的克隆,并進(jìn)行了限制性內(nèi)切酶處理后的電泳的照片。
圖17顯示了試驗例1中使用的(A)~(H)的DNA的電泳的照片。
圖18是表示經(jīng)試驗例1中使用的(A)~(H)的DNA轉(zhuǎn)化的枯草芽孢桿菌感受態(tài)細(xì)胞的轉(zhuǎn)化體出現(xiàn)數(shù)量的圖。
圖19是表示模擬1的各基因組裝規(guī)模中的單元DNA片段濃度的差異CV(%)和各單元DNA片段的相對量的關(guān)系的圖表。(a)是關(guān)于6個片段組裝的圖表,(b)是關(guān)于13個片段組裝的圖表,(c)是關(guān)于26個片段的圖表,(d)是關(guān)于51個片段組裝的圖表。
圖20是表示模擬1的6個片段組裝的情況下,CV=20%時的N(1條連接產(chǎn)物中含有的單元DNA的數(shù)量)和連接產(chǎn)物分子數(shù)的關(guān)系的圖表。
圖21中,(a)是模擬1中針對指數(shù)分布曲線進(jìn)行擬合推導(dǎo)出的針對單元DNA片段濃度差異CV(%)的λ函數(shù)的圖表,(b)是由模擬連接產(chǎn)物的N值的平均值求出的、針對單元DNA片段的濃度的差異CV(%)的λ函數(shù)的圖表。
圖22是表示模擬1中在λ噬菌體基因組重建的實驗中得到的組裝體中,關(guān)于#1、#2、#5、#7、#8、#9、#10、#11的錯誤連接位點(miss ligation site)的圖。
圖23顯示了模擬1中、對λ噬菌體基因組重建的實驗中片段數(shù)差異為CV=6.6%的51個單元DNA片段的連接產(chǎn)物實施脈沖場凝膠電泳后的照片。
圖24是模擬1中、將實際的連接效率和利用連接模擬得到的連接效率進(jìn)行比較的圖表。圖中,(a)是和連接效率為95%的模擬比較的圖表,(b)是和連接效率為96%的模擬比較的圖表,(c)是和連接效率為97%的模擬比較的圖表,(d)是和連接效率為98%的模擬比較的圖表,(e)是和連接效率為99%的模擬比較的圖表,(f)是和連接效率為100%的模擬比較的圖表。
圖25是表示用一般式f(N)=0.0058*CV(%)*exp(-0.058*CV(%)*N)得到的、模擬1的各基因組裝規(guī)模中的單元DNA濃度片段的差異CV(%)和各單元DNA片段的相對量之間的關(guān)系的圖表。
圖26是表示用一般式f(N)=0.0058*CV(%)*exp(-0.0058*CV(%)*N)得到的、單元DNA片段的濃度的差異和1條連接產(chǎn)物的平均單元DNA片段數(shù)之間的關(guān)系的圖表。
具體實施方式
以下,對本發(fā)明的實施方式進(jìn)行說明,但本發(fā)明不限于這些實施例。
<單元DNA組合物的制備方法>
本發(fā)明的單元DNA組合物的制備方法具有以下工序:針對連結(jié)有附加序列的多個單元DNA,準(zhǔn)備分別含有其中的每一種所述單元DNA的溶液的工序;在準(zhǔn)備所述各溶液后,在所述單元DNA連結(jié)有附加序列的狀態(tài)下,測定所述各溶液中的單元DNA的濃度,基于其結(jié)果分取所述各溶液,使各溶液中的單元DNA的摩爾數(shù)接近于彼此相同的工序。本說明書中,“單元DNA”的種類根據(jù)各自的堿基序列區(qū)分。另外,附加有限制性內(nèi)切酶識別位點和未附加限制性內(nèi)切酶識別位點的單元DNA二者均包括在“單元DNA”內(nèi)。
本發(fā)明中,測定含有單元DNA的溶液中各單元DNA的濃度時,各單元DNA連結(jié)有附加序列。由此,因連結(jié)有附加序列,在測定溶液的濃度時堿基序列的長度分布相應(yīng)地減小。因此,基于測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差減少。因此,通過基于該測定結(jié)果分取各溶液,并將各溶液中的單元DNA的摩爾數(shù)調(diào)整為彼此相同,各溶液中的摩爾比容易接近于1。需要說明的是,上述測定的“溶液中的單元DNA的濃度”,是指單元DNA的摩爾濃度。測定溶液中的單元DNA的摩爾濃度的方法沒有特別限制,例如,可以測定溶液中的單元DNA的質(zhì)量%,并由所測定的溶液中的單元DNA的質(zhì)量%的數(shù)值算出溶液中的單元DNA的摩爾濃度。測定溶液中的單元DNA的摩爾濃度的方法優(yōu)選使用能夠以DNA重量濃度±20%以內(nèi)的精確度進(jìn)行測定的手段來測定,更具體而言,優(yōu)選使用利用微量吸光光度計的紫外線吸收光譜法。
準(zhǔn)備含有連結(jié)有附加序列的單元DNA的溶液的工序沒有特別限制,例如,可以通過準(zhǔn)備單元DNA并在之后將附加序列連結(jié)至單元DNA的方法進(jìn)行。
單元DNA的準(zhǔn)備可以通過使用預(yù)先合成的單元DNA進(jìn)行,另外,也可以通過制作單元DNA進(jìn)行。單元DNA可以利用現(xiàn)有的已知方法制作,例如,可以利用鏈?zhǔn)骄酆厦阜磻?yīng)(PCR)、化學(xué)合成進(jìn)行制作。另外,向單元DNA附加限制性內(nèi)切酶識別序列的情況下,例如可以使用附加了限制性內(nèi)切酶識別序列(將在模板DNA上的堿基序列上產(chǎn)生各突出末端)的引物利用PCR來制作,或者,預(yù)先以能在末端產(chǎn)生任意的突出序列的方式整合限制性內(nèi)切酶識別序列,通過化學(xué)合成制作。針對制得的單元DNA,可以利用現(xiàn)有的已知方法確認(rèn)堿基序列,例如,可以將單元DNA整合至質(zhì)粒,通過利用雙脫氧鏈終止法的自動熒光測序儀對堿基序列加以測定來確認(rèn)。
附加序列沒有特別限制,可以是直鏈狀DNA,也可以是環(huán)狀的質(zhì)粒。使用環(huán)狀的質(zhì)粒DNA序列時,連結(jié)有附加序列的單元DNA將具有環(huán)狀結(jié)構(gòu),因此,能夠轉(zhuǎn)化至例如大腸桿菌等宿主中。
質(zhì)粒DNA的種類沒有特別限制,為了能在轉(zhuǎn)化的宿主中復(fù)制質(zhì)粒DNA,優(yōu)選地,質(zhì)粒DNA序列具有復(fù)制起點。具體而言,大腸桿菌的高拷貝質(zhì)粒載體pUC19或其衍生質(zhì)粒是優(yōu)選的。另外,從減小連結(jié)有附加序列的DNA間的長度分布、從而使單元DNA的摩爾數(shù)更接近于彼此相同的觀點考慮,所有單元DNA被克隆至相同種類的質(zhì)粒載體是優(yōu)選的。
附加序列和單元DNA的連結(jié)可以通過例如使用了DNA連結(jié)酶的連接進(jìn)行,連結(jié)至質(zhì)粒DNA的情況下,也可以通過TA克隆法進(jìn)行。
單元DNA各自的堿基長度和與各單元DNA連結(jié)的附加序列的堿基長度的合計總長度的分布的標(biāo)準(zhǔn)偏差沒有特別限制,該標(biāo)準(zhǔn)偏差小時,基于對溶液中DNA的濃度的測定結(jié)果算出的各單元DNA摩爾數(shù)的誤差將減少,因此,能夠使各溶液中的單元DNA的摩爾數(shù)更接近于彼此相同。具體而言,單元DNA的各堿基長度和與各單元DNA連結(jié)的附加序列的堿基長度的合計總長度的分布的標(biāo)準(zhǔn)偏差優(yōu)選為相對于總長度平均值而言±20%以內(nèi),更優(yōu)選為±15%以內(nèi),進(jìn)一步優(yōu)選為±10%以內(nèi),進(jìn)一步優(yōu)選為±5%以內(nèi),進(jìn)一步優(yōu)選為±1%以內(nèi),最優(yōu)選為±0.5%以內(nèi)。
與各單元DNA連結(jié)的附加序列的平均堿基長度沒有特別限制,其比單元DNA的平均堿基長度更長時,基于溶液中的DNA的濃度的測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差將減少,因此,能夠使各溶液中的單元DNA的摩爾數(shù)更接近于彼此相同。具體而言,與各單元DNA連結(jié)的附加序列的平均堿基長度優(yōu)選相對于單元DNA的平均堿基長度而言為2倍以上,更優(yōu)選為5倍以上,進(jìn)一步優(yōu)選為10倍以上,最優(yōu)選為20倍以上。另外,如果與單元DNA連結(jié)的附加序列的平均堿基長度過長,則將難于對連結(jié)有附加序列的單元DNA進(jìn)行操作。因此,與各單元DNA連結(jié)的附加序列的平均堿基長度優(yōu)選相對于單元DNA的平均堿基長度而言為10000倍以下(具體而言,為5000倍以下、3000倍以下、1000倍以下、500倍以下、250倍以下、100倍以下等)等。
單元DNA各自的長度沒有特別限制,對單元DNA的堿基序列進(jìn)行確認(rèn)時如果堿基序列測定的次數(shù)少,則能夠削減時間、費用的成本,故而優(yōu)選。因此,對各單元DNA的長度而言,短是優(yōu)選的,具體而言,優(yōu)選為1600bp以下,更優(yōu)選為1200bp以下。特別地,通過使用雙脫氧鏈終止法的自動熒光測序儀來測定堿基序列時,1次堿基序列測定中能夠確認(rèn)連續(xù)長度為800堿基左右的堿基序列,因此,單元DNA各自的長度最優(yōu)選為800bp以下(具體而言,為600bp以下、500bp以下、400bp以下、200bp以下、100bp以下等)。此時,各單元DNA的長度較短,因此將其用于下文所述的DNA連結(jié)體的制作中時,需要很多個單元DNA。但是,如果使用通過本發(fā)明的方法制備的單元DNA,如后文所述,可以實現(xiàn)很多個單元DNA的連結(jié)。另外,如果各單元DNA的長度過短,則單元DNA數(shù)增加,操作效率下降。因此,各單元DNA的長度優(yōu)選為20bp以上,更優(yōu)選為30bp以上,進(jìn)一步優(yōu)選為50bp以上。
根據(jù)本發(fā)明的制備方法,單元DNA組合物的用途沒有特別限制,按照本發(fā)明的方法、利用制備方法制備而得的單元DNA組合物可以用于制作含有由該單元DNA構(gòu)成的組裝DNA的DNA連結(jié)體。使用按照本發(fā)明的方法利用制備方法制備得到的單元DNA組合物通過后述的方法制作DNA連結(jié)體時,能夠連結(jié)很多個單元DNA(例如50種以上)。這可能是因為,按照本發(fā)明的方法、利用制備方法制備而得的單元DNA組合物中,各單元DNA的摩爾數(shù)更加準(zhǔn)確地接近于相同。
本發(fā)明中,準(zhǔn)備含有單元DNA的溶液的工序可以包括設(shè)計單元DNA的工序。單元DNA的設(shè)計沒有特別限制,例如,將單元DNA組合物用于制作含有組裝DNA的DNA連結(jié)體時,可以以所述組裝DNA中下述位置的序列附近的非回文序列為界,設(shè)計在端部具有非回文序列的所述單元DNA,所述位置是以用所述組裝DNA的序列的堿基長度除以所述單元DNA的種類數(shù)時各段堿基長度相等的方式將所述組裝DNA等分時的位置。以上述方式設(shè)計單元DNA時,各單元DNA的長度為大致相同的長度。因此,用于下文所述的DNA連結(jié)體的制作時,在利用限制性內(nèi)切酶除去附加序列并進(jìn)行電泳之后的尺寸分級分離中,將出現(xiàn)為位置大致相同的條帶,因此,可以通過1次尺寸分級分離回收單元DNA,從提高操作效率的觀點考慮是優(yōu)選的?!皩⑺鼋M裝DNA等分時的位置的序列附近”沒有特別限制,可以根據(jù)堿基序列的長度適當(dāng)設(shè)定。例如,各單元DNA的堿基長度為1000bp時,距“將組裝DNA等分的位置”100bp以內(nèi)(具體而言,為90bp以內(nèi)、80bp以內(nèi)、70bp以內(nèi)、60bp以內(nèi)、50bp以內(nèi)、30bp以內(nèi)、20bp以內(nèi)、10bp以內(nèi)、5bp以內(nèi)等)是可行的。
另外,像上述那樣地設(shè)計單元DNA時,在制作含有目標(biāo)組裝DNA的DNA連結(jié)體時,優(yōu)選設(shè)計成單元DNA的端部具有非回文序列(不是回文序列的序列)。對于設(shè)計為這樣的單元DNA而言,將所述非回文序列作為突出序列時,將形成后述的彼此能夠以保持順序的狀態(tài)重復(fù)連結(jié)的結(jié)構(gòu)。
<DNA連結(jié)體的制作方法>
本發(fā)明包括DNA連結(jié)體的制作方法。根據(jù)上述的方法,本發(fā)明的DNA連結(jié)體的制作方法包括下述工序:制備單元DNA組合物的工序、準(zhǔn)備載體DNA的工序、用限制性內(nèi)切酶從制備得到的溶液中的連結(jié)有附加序列的單元DNA中除去各附加序列的工序、和在除去工序后將載體DNA及各單元DNA彼此連結(jié)的工序。
DNA連結(jié)體含有大于1個的組裝DNA單元(unit),用于微生物細(xì)胞轉(zhuǎn)化。組裝DNA單元包含載體DNA和組裝DNA。DNA連結(jié)體的組裝DNA單元數(shù)只要大于1則沒有特別限制,為了提高轉(zhuǎn)化效率,優(yōu)選為1.5以上,更優(yōu)選為2以上,進(jìn)一步優(yōu)選為3以上,最優(yōu)選為4以上。
載體DNA具有在作為轉(zhuǎn)化對象的宿主微生物中有效的復(fù)制起點。對于載體DNA而言,只要具有在能夠轉(zhuǎn)化DNA連結(jié)體的微生物中實現(xiàn)DNA的復(fù)制的序列,則沒有特別限制,例如,可以舉出在后述芽孢桿菌(Bacillus)屬細(xì)菌(枯草芽孢桿菌)中有效的復(fù)制起點的序列。關(guān)于在枯草芽孢桿菌中有效的復(fù)制起點的序列,沒有特別限制,例如,作為具有θ型的復(fù)制機(jī)理的序列,可以舉出pTB19(Imanaka,T.,et al.J.Gen.Microbioi.130,1399-1408.(1984))、pLS32(Tanaka,T and Ogra,M.FEBS Lett.422,243-246.(1998))、pAMβ1(Swinfield,T.J.,et al.Gene87,79-90.(1990))等質(zhì)粒中含有的復(fù)制起點等的序列。
組裝DNA包含上述的各單元DNA彼此連結(jié)而成的DNA。本發(fā)明中的所謂DNA,是作為克隆對象的DNA,其種類、大小沒有特別限制。具體而言,可以是原核生物、真核生物、病毒等天然來源的序列、人工設(shè)計序列等。在本發(fā)明的方法中,如前文所述,能夠在質(zhì)粒上連結(jié)多數(shù)的單元DNA,因此,優(yōu)選使用堿基長度長的DNA。作為堿基長度長的DNA,例如,可以舉出構(gòu)成一系列代謝途徑的基因群、噬菌體等的基因組DNA的整體或基因組DNA的一部分等。
對于組裝單元DNA而言,除了載體DNA、組裝DNA以外,可以根據(jù)需要含有合適的堿基序列,也可以不含有。例如,制作用于表達(dá)組裝DNA含有的基因的質(zhì)粒時,可以含有啟動子(promoter)、操縱子(operator)、激活子(activator)、終止子(terminator)等控制轉(zhuǎn)錄翻譯的堿基序列。作為以枯草芽孢桿菌作為宿主時的啟動子,具體而言,可以舉出能夠以IPTG(異丙基-β-D-硫代半乳糖苷,isopropyls-D-thiogalactopyranoside)控制表達(dá)的Pspac(Yansura,D.and Henner,D.J.Pro.Natl.Acad.Sci,USA 81,439-443.(1984.))、或Pr啟動子(Itaya,M.Biosci.Biotechnol.Biochem.63,602-604.(1999))等。
載體DNA及各單元DNA具有能夠以彼此保持順序的狀態(tài)重復(fù)連結(jié)的結(jié)構(gòu)。本說明書中,所謂“保持彼此的順序的狀態(tài)下連結(jié)”,是指在組裝DNA單元上具有相鄰的序列的單元DNA或載體DNA在保持其順序及方向的狀態(tài)下結(jié)合。另外,所謂“重復(fù)連結(jié)”,是指具有5’末端的堿基序列的單元DNA或載體DNA的5’末端與具有3’末端的堿基序列單元DNA或載體DNA的3’末端結(jié)合。作為這樣的單元DNA,具體而言,例如,可以舉出具有利用片段的突出末端的堿基序列的互補(bǔ)性從而能夠以彼此保持順序的狀態(tài)重復(fù)連結(jié)的末端的單元DNA。關(guān)于該突出的結(jié)構(gòu),為非回文序列時,5’末端突出、3’末端突出的形狀不同亦可,沒有特別限制。
上述突出末端優(yōu)選通過使用限制性內(nèi)切酶從單元DNA中除去各附加序列的工序來制作。因此,利用本發(fā)明的方法制作DNA連結(jié)體時,為了使被附加序列能被該限制性內(nèi)切酶除去,單元DNA優(yōu)選具有限制性內(nèi)切酶識別序列。對于載體DNA的準(zhǔn)備而言,可以通過例如實施限制性內(nèi)切酶處理來設(shè)置能夠使得載體DNA和單元DNA以彼此保持順序的狀態(tài)重復(fù)連結(jié)的突出末端。
用于上述的附加序列的除去的限制性內(nèi)切酶沒有特別限制,優(yōu)選為II型限制性內(nèi)切酶,更優(yōu)選為AarI、BbsI、BbvI、BcoDI、BfuAI、BsaI、BsaXI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BtgZI、FokI、SfaNI等可以在距離識別序列的外側(cè)為固定長度的位置制作任意的序列的突出末端的IIS型限制性內(nèi)切酶。使用IIS型限制性內(nèi)切酶時,則能夠使得單元DNA的突出末端在各連結(jié)部位不同,因此,能夠確保其連結(jié)順序。另外,在載體DNA的準(zhǔn)備中,與單元DNA的準(zhǔn)備同樣地,以設(shè)置能夠?qū)崿F(xiàn)和單元DNA在保持彼此的順序的狀態(tài)下重復(fù)連結(jié)的突出末端的方式,用IIS型限制性內(nèi)切酶進(jìn)行載體DNA準(zhǔn)備是優(yōu)選的。
對于各單元DNA,在根據(jù)用于附加序列的除去的限制性內(nèi)切酶的種類分類為各組時,在除去工序前,可以將每個組的2種以上的含有單元DNA的溶液混合。由此,不需要對每個單元DNA分別進(jìn)行限制性內(nèi)切酶處理,而是可以對每個限制性內(nèi)切酶組一次性實施限制性內(nèi)切酶處理,此外,例如利用進(jìn)行電泳單元DNA的分離時,通過一次分離即可回收單元DNA,因此,操作的效率提高。另外,存在多個單元DNA的組時,針對每個組實施分離、回收單元DNA時,可能會在組間產(chǎn)生回收量的誤差,因此,在單元DNA間統(tǒng)一的摩爾數(shù)方面可能會產(chǎn)生誤差。因此,根據(jù)用于附加序列的除去的限制性內(nèi)切酶的種類分類為各組時,組數(shù)少的情況是優(yōu)選的,即,優(yōu)選用于附加序列的除去的限制性內(nèi)切酶的種類少的情況。因此,使用的限制性內(nèi)切酶的種類優(yōu)選為5種以下,更優(yōu)選為3種以下,最優(yōu)選為為1種。即,如果使用的限制性內(nèi)切酶為一種,則可以將全部含有單元DNA的溶液混合,因此,操作的效率大幅度提高,此外,在單元DNA間統(tǒng)一的摩爾數(shù)方面不易產(chǎn)生誤差。需要說明的是,限制性內(nèi)切酶是以摩爾數(shù)大致相等的狀態(tài)被混合的,因此,即使使用這樣混合的溶液,也能夠連結(jié)多數(shù)的單元DNA。
向單元DNA附加IIS型限制性內(nèi)切酶識別序列時,以不識別各單元DNA具有的序列的方式設(shè)計單元DNA的限制性內(nèi)切酶識別序列。即,按照以下方式設(shè)計各單元DNA的限制性內(nèi)切酶識別序列:計劃使用某種IIS型限制性內(nèi)切酶時,如果該IIS型限制性內(nèi)切酶雖然不識別某一單元DNA的序列、但識別其他的單元DNA的序列,則針對所述其他的單元DNA使用與該IIS型限制性內(nèi)切酶不同的IIS型限制性內(nèi)切酶。這樣設(shè)計時,盡管用于每個單元DNA的IIS型限制性內(nèi)切酶不同,但可以根據(jù)該IIS型限制性內(nèi)切酶的種類,以上述組別分類來使用單元DNA。如果存在對各單元DNA中的任一序列均不識別的IIS型限制性內(nèi)切酶,則通過設(shè)計附加有該限制性內(nèi)切酶識別序列的單元DNA,能夠利用1種IIS型限制性內(nèi)切酶從所有單元DNA中除去附加序列。
將載體DNA及各單元DNA彼此連結(jié)的工序沒有特別限制,可以在實施限制性內(nèi)切酶處理后,將限制性內(nèi)切酶處理后的附加序列和單元DNA分離,通過用DNA連接酶等將分離的單元DNA和載體DNA連結(jié)(連接)而進(jìn)行。由此,可以制作微生物轉(zhuǎn)化用DNA連結(jié)體。需要說明的是,連結(jié)工序中的單元DNA是未附加有限制性內(nèi)切酶識別序列的單元DNA。
附加序列和單元DNA的分離方法沒有特別限制,限制性內(nèi)切酶處理后的各單元DNA的摩爾比率的關(guān)系不發(fā)生顯著變化的方法是優(yōu)選的,具體而言,優(yōu)選利用瓊脂凝膠電泳。
單元DNA和載體DNA的連結(jié)方法沒有特別限制,優(yōu)選在聚乙二醇和鹽的存在下進(jìn)行。作為鹽,更優(yōu)選為1價的堿金屬的鹽。更具體而言,更優(yōu)選在含有10%的聚乙二醇6000和250mM的氯化鈉的連接反應(yīng)液中進(jìn)行。另外,連接反應(yīng)液中各單元DNA的濃度沒有特別限制,各自濃度為1fmol/μl以上是優(yōu)選的。連接反應(yīng)的溫度、時間沒有特別限制,優(yōu)選為37℃、30分鐘以上。需要說明的是,對于連接反應(yīng)液中的載體DNA而言,優(yōu)選地,在反應(yīng)前對含有載體DNA的溶液的DNA濃度進(jìn)行測定,并將其調(diào)節(jié)為與單元DNA的摩爾數(shù)相等。
本發(fā)明涉及的DNA連結(jié)體的制備方法可以包括或不包括(但優(yōu)選包括)以下工序:基于目標(biāo)連結(jié)數(shù)(以構(gòu)成組裝單元的DNA單元的數(shù)量和組裝單元的數(shù)量的乘積表示)的DNA片段的收率與該DNA片段的濃度的變動系數(shù)(以下,在本說明書中稱為“變動系數(shù)1”)的關(guān)系式(以下,在本說明書中稱為“關(guān)系式”),調(diào)節(jié)連結(jié)工序中的載體DNA及各單元DNA的濃度的變動系數(shù)(以下,在本說明書中稱為“變動系數(shù)2”)。需要說明的是,變動系數(shù)1為關(guān)系式中出于便利而使用的變動系數(shù),變動系數(shù)2是實際的連結(jié)工序中的單元DNA及載體DNA的濃度的變動系數(shù)。通過包括該調(diào)節(jié)工序,在連結(jié)工序中嘗試使期望的數(shù)量的單元DNA(例如,片段數(shù)量為50的單元DNA)連結(jié)時,通過將變動系數(shù)2調(diào)節(jié)為上述關(guān)系式所示的范圍,能夠?qū)崿F(xiàn)這樣的連結(jié)。
目標(biāo)連結(jié)數(shù)是指連結(jié)工序中意欲連結(jié)的期望的DNA片段的數(shù)量,更具體而言,以構(gòu)成連結(jié)組裝單元的單元DNA的數(shù)量和組裝單元的數(shù)量的乘以表示。所謂“目標(biāo)連結(jié)數(shù)的DNA片段的收率”,是指構(gòu)成連結(jié)后的組裝單元DNA的DNA的片段數(shù)相對于用于連結(jié)的DNA的總片段數(shù)的比例。
本發(fā)明涉及的關(guān)系式是表示目標(biāo)連結(jié)數(shù)的DNA片段的收率和變動系數(shù)1之間的關(guān)系的關(guān)系式,例如,可以使用由利用計算機(jī)的連接模擬(ligation simulation)求出的關(guān)系式。更具體而言,關(guān)系式可以通過以下方法設(shè)定:例如,在使變動系數(shù)1為0~20%且以1%為單位變化的單元DNA片段群(例如,10~30群)中實施連接模擬,調(diào)查DNA連結(jié)體的單元DNA片段數(shù)的分布(例如,指數(shù)分布),針對該分布繪制擬合曲線(fitting curve),利用該擬合曲線進(jìn)行設(shè)定。作為用于具體的連接模擬的工具,沒有特別限制,可以使用現(xiàn)有的已知手段,例如,可以用表格計算軟件Excel(注冊商標(biāo))2007的VBA(Visual Basic for Applications)進(jìn)行編程,設(shè)定需要的算法來實施模擬。另外,擬合曲線可以利用例如表格計算軟件Excel(注冊商標(biāo))2007的指數(shù)近似曲線功能繪制。基于關(guān)系式的變動系數(shù)2的調(diào)整可以按照以下方法進(jìn)行:例如,在設(shè)計關(guān)系式后,將期望的DNA片段的收率代入關(guān)系式中,以使得連結(jié)時的DNA片段滿足算出的變動系數(shù)1的方式來對連結(jié)前各工序中的操作加以調(diào)整。該調(diào)整方法沒有特別限制,例如,可以在準(zhǔn)備載體DNA的工序、制備單元DNA的工序、將載體DNA及各單元DNA彼此連結(jié)的工序等各工序中,測定載體DNA或各單元DNA的濃度時,在選擇用于所述測定的測定設(shè)備(吸光光度計、吸光熒光光度計、實時PCR裝置等)時,可以以使得變動系數(shù)2成為期望的變動系數(shù)的方式對預(yù)先判明了測定誤差的設(shè)備加以選擇。
變動系數(shù)2沒有特別限制,如果連結(jié)時的單元DNA的濃度的誤差小,則能夠連結(jié)更多的單元DNA。因此,變動系數(shù)2優(yōu)選為20%以下,更優(yōu)選為15%以下,進(jìn)一步優(yōu)選為10%以下,進(jìn)一步優(yōu)選為8%以下,最優(yōu)選為5%以下。
本發(fā)明的DNA連結(jié)體的制備方法還可以在除去工序后、連結(jié)工序之前具有使限制性內(nèi)切酶失活的工序。如果在單元DNA內(nèi)部存在有用于切割分離其他單元DNA的附加序列的限制性內(nèi)切酶切割位點,則難以在限制性內(nèi)切酶失活前的階段將具有附加序列的單元DNA群混合。因此,無法通過將這些單元DNA群整合來一并進(jìn)行單元DNA的分離。但是,通過使限制性內(nèi)切酶失活,在失活后,能夠?qū)⒕哂懈郊有蛄械膯卧狣NA群整合,從而能夠一并進(jìn)行單元DNA的分離。由此,在連結(jié)工序中,容易制作含有更多的組裝DNA單元的DNA連結(jié)體,結(jié)果,更容易進(jìn)行枯草芽孢桿菌的轉(zhuǎn)化。限制性內(nèi)切酶的失活可以通過現(xiàn)有的已知方法進(jìn)行,例如,可以通過苯酚·氯仿處理進(jìn)行。
作為成為轉(zhuǎn)化對象的宿主微生物,只要是具有自然轉(zhuǎn)化能力的微生物,則沒有特別限制。作為自然轉(zhuǎn)化能力,例如,可以舉出在引入DNA時將其處理為單鏈DNA并引入的能力等。具體而言,可以舉出芽孢桿菌屬細(xì)菌、鏈球菌(Streptococcus)屬細(xì)菌、嗜血桿菌(Haemophilus)屬細(xì)菌、及奈瑟菌(Neisseria)屬。另外,作為芽孢桿菌屬細(xì)菌,可以舉出B.subtilis(枯草芽孢桿菌)、B.megaterium(巨大芽孢桿菌)、B.stearothermophilus(嗜熱脂肪芽孢桿菌)等。其中,作為最優(yōu)選的微生物,可以舉出自然轉(zhuǎn)化能力及重組能力優(yōu)異的枯草芽孢桿菌。
利用本發(fā)明的方法制作的DNA連結(jié)體可以用于微生物細(xì)胞的轉(zhuǎn)化,使作為轉(zhuǎn)化對象的微生物成為感受態(tài)的方法可以選擇適合各微生物的已知方法。具體而言,例如,對于枯草芽孢桿菌而言,優(yōu)選使用Anagnostopoulou,C.and Spizizen,J.J.Bacteriol.,81,741-746(1961)中記載的方法。此外,關(guān)于轉(zhuǎn)化的方法而言,也可以使用適合各微生物的已知方法。提供給感受態(tài)細(xì)胞的連接產(chǎn)物的溶液量也沒有特別限制。優(yōu)選為相對于感受態(tài)細(xì)胞培養(yǎng)液為1/20的量至等量,更優(yōu)選為一半的量。從轉(zhuǎn)化體中提純質(zhì)粒的方法也可以使用已知方法。
關(guān)于從轉(zhuǎn)化體中提純的質(zhì)粒是否含有組裝DNA,可通過利用限制性內(nèi)切酶切割產(chǎn)生的片段的尺寸模式(size pattern)、PCR法、堿基序列測定法來進(jìn)行確認(rèn)。另外,插入DNA具有生成物質(zhì)等功能時,可以通過檢測該功能進(jìn)行確認(rèn)。
實施例
通過以下所示的實施例對本發(fā)明進(jìn)行更具體的說明,但以下的實施例僅表示本發(fā)明的一個例子,本發(fā)明的范圍不限于以下的實施例。
(材料)
作為成為轉(zhuǎn)化對象的微生物細(xì)胞,使用了枯草芽孢桿菌。作為枯草芽孢桿菌,使用了RM125株(Uozumi,T.,et al.Moi.Gen.Genet.,152,65-69(1977))和其派生株BUSY9797株。作為在枯草芽孢桿菌中能夠復(fù)制的載體DNA,使用了用pGET118(Kaneko,S.,et al.Nucleic Acids Res.31,e112(2003))如后述那樣地構(gòu)建而成的pGETS118-AarI-pBR(參見序列號31)、pGETS151-pBR(參見序列號32)。作為組裝DNA,使用了λ噬菌體DNA(東洋紡公司制)(參見序列號33)和后述的甲羥戊酸途徑人工操縱子(operon)(參見序列號34)。對于具有整合有單元DNA的質(zhì)粒DNA的大腸桿菌篩選,使用了抗生物質(zhì)羧芐青霉素(carbenicillin)(和光純藥工業(yè)公司)。對于枯草芽孢桿菌的篩選使用了抗生物質(zhì)四環(huán)素(Sigma公司)。IIS型限制性內(nèi)切酶使用了AarI(Thermo公司)、BbsI(NEB公司)、BsmBI(NEB公司)、SfiI(NEB公司)。限制性內(nèi)切酶HindIII、PvuII、T4DNA Ligase使用了Takara Bio公司制的酶。用于大腸桿菌的質(zhì)粒構(gòu)建的通常的連接使用了Takara Ligation Kit(Mighty)(Takara Bio公司)。用于制備單元DNA的PCR反應(yīng)使用了東洋紡公司制的KOD plus polymerase。用于測定克隆至質(zhì)粒的DNA的堿基序列的菌落PCR(colony PCR)使用了Takara Bio公司制的Ex-Taq HS。作為整合單元DNA的附加序列的質(zhì)粒DNA使用了pMD-19(simple)(Takara Bio公司)。環(huán)狀質(zhì)粒純化用酶Plasmid Saf e使用了EPICENTER公司制的酶。電泳用瓊脂凝膠使用了用于DNA電泳的低熔點瓊脂凝膠2-Hydroxyethylagarose(Sigma公司)、或UltraPure Agarose(Invitrogen公司)。限制性內(nèi)切酶的失活使用了苯酚:氯仿:異戊醇25:24:1(的混合液),TE飽和苯酚(含有8-羥基喹啉)使用了Nacalai Tesque公司制的試劑。λ末端酶使用了EPICENTER公司制的酶。λ噬菌體的包裝(packaging)使用了Agilent Technologies公司的Gigapack III Plus Packaging Extract。溶菌酶使用了和光純藥工業(yè)公司制的酶。LB培養(yǎng)基的培養(yǎng)基成分及瓊脂使用了Becton,Dickinson and Company制的試劑。IPTG(異丙基-β-D-硫代半乳糖苷,isopropyls-D-thiogalactopyranoside)使用了和光純藥工業(yè)公司制的試劑。除了上述以外的所有其他的培養(yǎng)基成分及生化學(xué)試劑均使用了和光純藥工業(yè)公司制的產(chǎn)品。除非有特別記載,質(zhì)粒的構(gòu)建使用了大腸桿菌DH5α株、JM109株或TOP10株中的任一種。構(gòu)建的質(zhì)粒從大腸桿菌中的少量提純使用了QIAGEN公司的QIAprep Spin Miniprep Kit,大量提純使用了同公司的QIAfilter Midi Kit。DNA從酶反應(yīng)液中的純化回收使用了QIAGEN公司的MinElute Reaction Cleanup Kit、或QIAGEN公司的QIAquick PCR purification Kit。純化通過通常的瓊脂凝膠電泳分離得到的凝膠塊時,使用了QIAGEN公司的MinElute Gel Extraction Kit。超微量吸光光度計使用了Thermo公司的nano-drop2000。堿基序列測定使用了Applied Biosystems公司制的熒光自動測序儀3130xl Genetic Analyzer。關(guān)于其他的常見DNA操作,按照標(biāo)準(zhǔn)方案(Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork(1989))實施??莶菅挎邨U菌的轉(zhuǎn)化和質(zhì)粒提取按照已知方法實施(Tsuge,K.,et al.,Nucleic Acids Res.31,e133.(2003))。
(用于組裝的載體DNA的構(gòu)建)
用于λ噬菌體DNA的組裝的載體DNA即pGETS118-AarI-pBR(序列號1)是基于具有大腸桿菌的F因子的復(fù)制起點oriS、在枯草芽孢桿菌中發(fā)揮作用的復(fù)制起點repA的大腸桿菌―枯草芽孢桿菌間穿梭(shuttle)質(zhì)粒載體pGETS118(Kaneko,et.al.,Nucleic Acids Res.,31,e112.(2003))經(jīng)過多個階段的過程構(gòu)建而成的質(zhì)粒,其結(jié)構(gòu)如圖1所示。組裝基因的克隆位點位于2個AarI切割位點之間,在組裝時,這2個AarI切割位點間的序列被除去,并且,為了使在大腸桿菌中更容易取得載體,導(dǎo)入了大腸桿菌的多拷貝質(zhì)粒pBR322的復(fù)制起點和氨芐青霉素抗性基因。另外,對于pGETS118內(nèi)部的四環(huán)素抗性基因中存在的天然的AarI切割位點,通過以不影響四環(huán)素抗性基因(tetL)的氨基酸序列的方式導(dǎo)入1堿基的突變,使識別位點消失。用于甲羥戊酸途徑人工操縱子的組裝的載體DNA即pGETS151-pBR(序列號2)是通過將以上述的pGETS118-AarI-pBR的DNA作為模板、利用PartA(5’-TAGGGTCTCAaagcggccgcaagctt-3’(參見序列號5)和5’-TAGGGTCTCAGCggccaagaaggcc-3’(參見序列號6))、PartB(5’-TAGGGTCTCAccGCCCTTCCCGGTCGA TAT-3’(參見序列號7)和5’-TAGGGTCTCAtaTTAGCTTAATTG TTATCCGCTCACAATTCC-3’(參見序列號8))、PartC(5’-TAGG GTCTCAAAtaactggaaaaaattagtgtctcatggttcg-3’(參見序列號9)和5’-TAGGGTCTCAgcttaagtggtgggtagttgacc-3’(參見序列號10))擴(kuò)增的片段連結(jié)制作而成的載體DNA,與原來的質(zhì)粒相比,除去了僅在大腸桿菌中發(fā)揮作用的基因區(qū)(gene region)(cat~oriS之間、parA~parC之間)(圖1)。該載體DNA在組裝基因時僅能夠在枯草芽孢桿菌中復(fù)制,但在基因組裝中,表現(xiàn)出與pGETS118-AarI-pBR 相同的性質(zhì)。在約10μl的這些質(zhì)粒的溶液(相當(dāng)于5μg)中添加29μl滅菌水、5μl限制性內(nèi)切酶附帶的10×Buffer_for_AarI、1μl同樣為限制性內(nèi)切酶附帶的用于激活切割的50×Oligoncleotide、5μl限制性內(nèi)切酶AarI(Thermo公司),于37℃反應(yīng)2小時。利用低熔點瓊脂凝膠電泳將得到的液體分離后,從凝膠中切出載體自身為約15kb的片段(為pGETS118-AarI-pBR時)、或4.3kb的片段(為pGETS151-pBR時),純化目標(biāo)載體DNA,溶解于20μl的TE。關(guān)于載體DNA的濃度的測定,取1μl該TE溶液,利用超微量吸光光度計進(jìn)行測定。
(單元DNA分割區(qū)域的設(shè)定)
關(guān)于4個堿基突出的多樣性,存在4的4次方即256種。根據(jù)以下基準(zhǔn),從中選定用于本發(fā)明的突出序列。首先,扣除形成回文的總計16個序列(0組)(AATT,ATAT,TATA,TTAA,CCGG,CGCG,GCGC,GGCC,ACGT,AGCT,TCGA,TGCA,CATG,CTAG,GATC,GTAC),這些序列的互補(bǔ)序列也是相同的序列,同一種片段能夠彼此連結(jié),因此,無法在本發(fā)明中使用。關(guān)于剩余的240個序列,由于包含某一序列(例如,CCTA)及其互補(bǔ)序列(TAGG),因此,能夠用于DNA連結(jié)的突出序列的組合理論上為240÷2=120組。其中,根據(jù)GC含量的不同和這些GC堿基的出現(xiàn)順序的不同,基于以下的基準(zhǔn)將突出組合分組。
(I組)突出僅由A和T構(gòu)成,共6種組合(AAAA/TTTT,TAAA/TTTA,ATAA/TTAT,AATA/TATT,AAAT/ATTT,ATTA/TAAT)。
(II組)A和T共計3個、且C和G共計1個,共32種組合(CAAA/TTTG,ACAA/TTGT,AACA/TGTT,AAAC/GTTT,GAAA/TTTC,AGAA/TTCT,AAGA/TCTT,AAAG/CTTT,CAAT/ATTG,ACAT/ATGT,AACT/AGTT,AATC/GATT,GAAT/ATTC,AGAT/ATCT,AAGT/ACTT,AATG/CATT,CATA/TATG,ACTA/TAGT,ATCA/TGAT,ATAC/GTAT,GATA/TATC,AGTA/TACT,ATGA/TCAT,ATAG/CTAT,CTTA/TAAG,TCTA/TAGA,TTCA/TGAA,TTAC/GTAA,GTTA/TAAC,TGTA/TACA,TTGA/TCAA,TTAG/CTAA)。
(III組)A和T共計2個、且C和G共計2個,共52種組合,從中除去8種回文組合,為44種組合(AACC/GGTT,AACG/CGTT,AAGC/GCTT,AAGG/CCTT,ACAC/GTGT,ACAG/CTGT,ACCA/TGGT,ACCT/AGGT,ACGA/TCGT,ACTC/GAGT,ACTG/CAGT,AGAC/GTCT,AGAG/CTCT,AGCA/TGCT,AGGA/TCCT,AGTC/GACT,AGTG/CACT,ATCC/GGAT,ATCG/CGAT,ATGC/GCAT,ATGG/CCAT,CAAC/GTTG,CAAG/CTTG,CACA/TGTG,CAGA/TCTG,CATC/GATG,CCAA/TTGG,CCTA/TAGG,CGAA/TTCG,CGTA/TACG,CTAC/GTAG,CTCA/TGAG,CTGA/TCAG,CTTC/GAAG,GAAC/GTTC,GACA/TGTC,GAGA/TCTC,GCAA/TTGC,GCTA/TAGC,GGAA/TTCC,GGTA/TACC,GTCA/TGAC,GTGA/TCAC,TCCA/TGGA)。
(IV組)A和T共計1個、且C和G共計3個的共32種組合中,不含C和G三連排的共16種組合(CACC/GGTG,CCAC/GTGG,CTCC/GGAG,CCTC/GAGG,CACG/CGTG,CCAG/CTGG,CTCG/CGAG,CCTG/CAGG,CAGC/GCTG,CGAC/GTCG,CTGC/GCAG,CGTC/GACG,GAGC/GCTC,GGAC/GTCC,GTGC/GCAC,GGTC/GACC)。
(V組)A和T共計1個、且C和G共計3個的共32種組合中,存在C和G三連排的共16種組合(ACCC/GGGT,CCCA/TGGG,TCCC/GGGA,CCCT/AGGG,ACCG/CGGT,CCGA/TCGG,TCCG/CGGA,CCGT/ACGG,ACGC/GCGT,CGCA/TGCG,TCGC/GCGA,CGCT/AGCG,AGGC/GCCT,GGCA/TGCC,TGGC/GCCA,GGCT/AGCC)。
(VI組)突出僅由C和G構(gòu)成,共6種組合(CCCC/GGGG,GCCC/GGGC,CGCC/GGCG,CCGC/GCGG,CCCG/CGGG,CGGC/GCCG)。
如上述分割而成的組中,在實施例1及2中,從1組選擇了載體DNA和單元DNA的分界。另外,對于單元DNA間的分界,將III組(44種組合)和IV組(16種組合)合計60種突出組合選定為備選組合。關(guān)于各突出組合的指定,首先確定組裝對象的序列的完整堿基序列,然后,設(shè)定將該全長序列等分的理想分割分界。以下,以實施例1中使用的堿基序列作為具體例進(jìn)行說明。
實施例1中,將對于λ噬菌體基因組全長48502bp附加了cos位點16bp和組裝所需的突出序列4bp而成的48522bp作為重建的對象。以下表1是表示實施例1中的組裝DNA的理想分割單元、實際的分割單元及突出堿基序列的表。將除了組裝用質(zhì)粒載體以外的單元DNA分割為50個幾乎相同的大小,進(jìn)行準(zhǔn)備,并嘗試通過將這些片段連結(jié)進(jìn)行重建。理想情況下,希望將總計50個片段以長度均等的方式分割,但為了在組裝對象的序列中不導(dǎo)入任何堿基的變更,需要基于原本存在的序列制作用于組裝的4堿基的5’末端突出。然而,在所有理想分割分界上均恰好存在上述突出序列的可能性相當(dāng)于0,故而無法在理想分割分界將單元DNA均等分割。本實施例中,為了使片段長度盡可能地接近理想的分割單元的長度,針對突出組合的分配進(jìn)行了模擬。首先,以全長(48522bp)除以50而得的970bp作為理想分割單元,從絕對堿基號小的區(qū)域的單元DNA開始,依次命名為第01片段、第02片段、第03片段、……、第50片段。從該理想分割分界的絕對位置(即,第970和第971個堿基之間、第1940和第1941個堿基之間、第2910和第2911個堿基之間、…、第47530個和第47531個堿基之間)的位置起,以該理想分割分界為中心,在其左右分別以1個堿基為間隔,擴(kuò)大為4個堿基、6個堿基、8個堿基、10個堿基、12個堿基、14個堿基、16個堿基、18個堿基、20個堿基、22個堿基、24個堿基,調(diào)查是否存在成為上述的備選突出的4堿基序列。舉出一個具體的例子進(jìn)行說明(表1)。第01片段和第02片段的理想分割分界為第970個和第971個堿基之間。對于以該理想分割分界作為中心的16個堿基(從第963個堿基到第988個堿基的堿基序列即5’-ATGCTGCTGGGTGTTT-3’)而言,存在7種上述備選突出組合(ACAC/GTGT,AGCA/TGCT,ATGC/GCAT,CACC/GGTG,CAGC/GCTG,CCAG/CTGG,CTGC/GCAG)。通過該操作,以指定的堿基距離選取共49段理想分割單元周圍的堿基序列,確認(rèn)所述堿基序列的內(nèi)部是否存在至少1種備選突出的序列。結(jié)果,確認(rèn)到如果將選取的堿基距離擴(kuò)大到24bp,則全部選取的堿基序列中均存在至少1組作為備選突出的4個堿基。從各序列中存在的備選突出中選拔特定的突出時,首先,像上述那樣以備選突出組合的總數(shù)少的被選取序列為優(yōu)先、并以在全部被選取序列中的出現(xiàn)頻率低的突出組合序列為優(yōu)先進(jìn)行分配,由此,向所有分割單元分配了唯一的突出組合。
【表1】
(實施例1、利用50個單元DNA及載體DNA的組裝的λ噬菌體的點突變體的制作)
<λ噬菌體>
λ噬菌體是感染大腸桿菌的細(xì)菌噬菌體(bacterial phage),也是分子生物學(xué)中研究最為詳盡的噬菌體?;蚪M由全長48502bp的雙鏈DNA構(gòu)成,全部堿基序列均已判明。另外,已知存在各種突變體。本實施例中,嘗試?yán)?kb左右的短單元DNA制作λ噬菌體點突變體。
<λ噬菌體基因組的片段化設(shè)計>
λ噬菌體使用了東洋紡公司制的λphageDNA。以cos位點(黏端位點)使得該制品形成直鏈狀。調(diào)查了噬菌體基因組的全長堿基序列,結(jié)果,與數(shù)據(jù)庫中登錄的堿基序列(登錄號為J02459.1)比較有6處不同(g.138delG,g.14266_14267insG,g.37589C>T,g.37743C>T,g.43082G>A,g.45352G>A)(序列號3)(序列號3的全長在上述48522bp的基礎(chǔ)上進(jìn)一步含有一個突出末端的4堿基,即全長為48526bp)。使用得到的堿基序列,為了將全長48522bp(包含cos位點的重復(fù))分割為幾乎均等的長度,將理想分割分界設(shè)定為每片段為970bp,通過上述的(單元DNA分割區(qū)域的設(shè)定方法)進(jìn)行分割,結(jié)果,在各單元DNA群中分別特異性地分配了由表1所示的切割位點的右側(cè)的4堿基構(gòu)成的5’末端突出。
<生成突出的限制性內(nèi)切酶的種類的選定>
關(guān)于生成4個堿基的任意的突出序列的IIS型限制性內(nèi)切酶,可以舉出AarI(5’-CACCTGC(N)4/-3’,5’-/(N)8GCAGGTG-3’)、BbsI(5’-GAAGAC(N)2/-3’,5’-/(N)6GTCTTC-3’)、BbvI(5’-GCAGC(N)8/-3’,5’-/(N)12GCTGC-3’)、BcoDI(5’-GTCTCN/-3’,5’-/(N)5GAGAC-3’)、BfuAI(5’-ACCTGC(N)4/-3’,5’-/(N)8GCAGGT-3’)、BsaI(5’-GGTCTCN/-3’,5’-/(N)5GAGACC-3’)、BsmAI(BcoDI的同切點酶(isoschizomer))、BsmBI(5’-CGTCTCN/-3’,5’-/(N)5GAGACG-3’)、BsmFI(5’-GGGAC(N)10/-3’,5’-/(N)14GTCCC-3’)、BspMI(BfuAI的同切點酶)、BtgZI(5’-GCGATG(N)10/-3’,5’-/(N)14CATCGC-3’)、FokI(5’-GGATG(N)9/-3’5’-/(N)13CATCC-5’)、SfaNI(5’-GCATC(N)9/-3’,5’-/(N)13GATGC-5’)等。對這些限制性內(nèi)切酶中,在用于亞克隆基因片段的大腸桿菌質(zhì)粒載體(pMD19,Simple,TAKARA)中不存在、或者即使存在也會產(chǎn)生較之理想分割單元明顯更大的片段和明顯更小的片段的限制性內(nèi)切酶加以調(diào)查,結(jié)果,存在5種完全不具有其切割位點的酶(AarI,BbsI,BfuAI,BsmFI,BtgZI)和1種雖然在載體內(nèi)部存在識別序列、但產(chǎn)生較之理想分割單元明顯更大的片段和明顯更小的片段的限制性內(nèi)切酶(BsmBI),即合計存在6種備選。針對這些備選的限制性內(nèi)切酶位點,對于第01片段至第50片段的λ噬菌體整體調(diào)查限制性內(nèi)切酶位點的分布,結(jié)果,AarI為12處,BbsI為24處,BfuAI為41處,BsmFI為38處,BtgZI為45處,BsmBI為14處,對于任一種限制性內(nèi)切酶,均沒有在λ噬菌體基因組中不存在的限制性內(nèi)切酶識別位點。因此,針對每個單元DNA分別選擇并使用了不會切割內(nèi)部的限制性內(nèi)切酶。為了盡可能地減少使用的限制性內(nèi)切酶的種類,探討了限制性內(nèi)切酶的組合,結(jié)果,確認(rèn)到僅使用BbsI、AarI、BsmBI這3種即可滿足要求。用于切出各單元DNA的IIS型限制性內(nèi)切酶的分配如下。
用BbsI切割的組為第01~08·12·16~22·24·27·28·33~39·43·45~50片段,合計33片段;用AarI切割的組為第09~11·13·23·25·30·32·44片段,合計9片段;用BsmBI切割的組為第14·15·26·29·31·40~42片段,合計8片段。
<基因片段的克隆>
使用PCR法,利用λ噬菌體基因組全長擴(kuò)增從第01片段到第50片段的全部50個片段。首先,在用于擴(kuò)增通過上述確定的突出組合之間的DNA序列的引物的5’末端附加通過上述確定的限制性內(nèi)切酶識別位點,使所述位點位于期望的切出突出的位置,進(jìn)一步地,使用5’末端附加有TAG序列的引物。使用這些引物組,利用λ噬菌體基因組全長擴(kuò)增指定區(qū)域的DNA片段。PCR的反應(yīng)條件如下:每1個反應(yīng)中,添加5μl KOD Plus10×buffer Ver.2、3μl 25mM MgSO4、5μl dNTP(每種為2mM)、1μl KOD Plus(1unit/μl)、48pgλ噬菌體DNA(TOYOBO)、15pmol引物(F引物、R引物各自的濃度)、滅菌水,制備反應(yīng)體系(50μl),利用GeneAmp PCR System 9700(Applied Biosystems公司)按照以下的程序進(jìn)行。
于94℃孵育2min后,以于98℃ 10s、于55℃ 30s、于68℃ 1min作為1個循環(huán),實施30個該循環(huán),之后,于68℃孵育7min。在用含有2mg/ml的結(jié)晶紫(和光純藥工業(yè)公司)的1×TAE緩沖液(用milliQ水將Nacalai Tesque公司制“Tris-乙酸-EDTA緩沖原液(濃縮50倍)pH8.3(25℃時)”稀釋為50倍制成)制作的1%瓊脂凝膠(Ultra Pure Agarose,Invitrogen公司)中,使用電泳裝置(i-MyRun.NC,Cosmobio),將施加電壓設(shè)為100V,經(jīng)過10min的泳動時間將擴(kuò)增的單元DNA分離,利用刀片回收泳動凝膠中的目標(biāo)DNA的條帶,得到約200mg的凝膠碎片。使用Concert Rapid Gel Extraction System(Life Technologies Co.,Ltd.)從該凝膠碎片中純化單元DNA。具體而言,在凝膠碎片中添加體積數(shù)值為凝膠重量3倍的L1Buffer,在45℃的孵育器(block incubator)中放置約10min進(jìn)行溶解,將該溶液添加至附帶的純化柱濾芯(spin column cartirdge)(在2ml離心管中安裝有純化柱的部件),以20,000×g、1min離心并舍棄液體(flow-though)后,對于該純化柱添加750μl的L2Buffer,以20,000×g、1min離心并舍棄液體。為了更確實地除去純化柱中殘存的L2Buffer等殘渣,再次將純化柱以20,000×g、1min離心后,舍棄到該階段為止所使用的2ml離心管,將純化柱移至新的1.5ml離心管。對于該純化柱添加30μl的TE緩沖液(10mM Tris-HCl,1mM EDTA,pH8.0)并放置2min后,以20,000×g、1min離心,回收DNA溶液。在使用該回收DNA前將其于-20℃保存。將得到的單元DNA通過以下所示的TA克隆法克隆至大腸桿菌質(zhì)粒載體中。
在8μl單元DNA溶液中添加1μlTAKARA公司的PCR反應(yīng)用酶Ex-Taq附帶的10×Ex-TaqBuffer、0.5μl 100mM dATP、0.5μlEx-Taq,于65℃恒溫10min,在單元DNA的3’末端附加突出A。將1μl該單元DNA溶液與1μlTAKARA公司的pMD19-Simple和3μl滅菌水混合,并添加5μl TAKATA Ligation(Mighty)Mix,于16℃恒溫30min。將5μl該連接溶液添加至50μl的大腸桿菌DH5α的化學(xué)感受態(tài)細(xì)胞中,于冰上恒溫15min后,于42℃施加30sec熱激(heat shock),于冰上放置2min后,添加200μl LB培養(yǎng)基,于37℃恒溫1h,將其涂抹于含有羧芐青霉素(100μg/ml)和1.5%瓊脂的LB平板培養(yǎng)基(LB plate),于37℃過夜培養(yǎng),從而得到質(zhì)粒的轉(zhuǎn)化體。利用得到的菌落,使用PCR用模板DNA制備試劑(Cica Geneus DNA制備試劑,關(guān)東化學(xué)公司)進(jìn)行制備。具體而言,將試劑盒內(nèi)的試劑a和試劑b以1:10的比率混合,準(zhǔn)備2.5μl所得溶液,用牙簽采集少量平板培養(yǎng)基上的菌落,將其在所述溶液中懸濁后,于72℃處理6min,之后于94℃處理3min。對于得到的液體添加2.5μl TAKARA Ex-Taq用10×酶、2μl 2.5mM dNTP溶液、0.25μl 10pmol/μl的M13F引物、0.25μl 10pmol/μl的M13R引物、17μl滅菌水、0.5μl Ex-TaqHS,于94℃孵育5min后,以于98℃ 20sec、于55℃ 30sec、于72℃ 1min作為1個循環(huán),通過實施30個循環(huán)擴(kuò)增DNA,通過調(diào)查該P(yáng)CR產(chǎn)物的堿基序列,判斷其是否與期望的序列完全一致。最終,利用全部菌落得到正確的序列。在該過程中,在針對第10片段得到的突變體中,存在1個基因V的編碼區(qū)內(nèi)的同義取代突變體(g.9515G>C)。該突變導(dǎo)致在噬菌體基因組中新出現(xiàn)了限制性內(nèi)切酶AvaI識別位點(圖2)。在本實施例中,為了明確地體現(xiàn)構(gòu)建的噬菌體是人為制作的噬菌體,關(guān)于第10片段,不使用野生型,而是使用該同義取代突變體(g.9515G>C)。
<具有單元DNA的質(zhì)粒的高純度純化>
將含有克隆了具有期望的序列的第01~50的片段的質(zhì)粒的大腸桿菌轉(zhuǎn)化體合計50種類分別在50ml的添加了100μg/ml的羧芐青霉素的LB培養(yǎng)基中以37℃、120spm過夜培養(yǎng),對于得到的菌體,使用QIAfilter Plasmid Midi Kit(QIAGEN公司)進(jìn)行純化。在50μl得到的粗提取質(zhì)粒溶液中,添加5μl的3M乙酸鉀-乙酸緩沖液(pH5.2)和125μl的乙醇,以20000×g離心10min,用乙醇使DNA沉淀,將得到的沉淀用70%乙醇洗滌后,除去殘渣,再次溶解于50μl 的TE(pH8.0)中。為了測定濃度,取1μl該粗提取質(zhì)粒溶液,用超微量吸光光度計(ND-2000,Thermo公司)測定DNA濃度。在該時間點,粗提取質(zhì)粒溶液的DNA量大致為0.5~4μg/μl。參考測定值,從各粗提取質(zhì)粒溶液中采集5μg的DNA至1.5ml管中,添加滅菌水,使得各溶液的總體積成為50μl。在所述溶液中添加6μl Plasmid Safe(Epicentre公司)的10×反應(yīng)緩沖液、2.4μl 25mMATP溶液、2μl Plasmid Safe酶溶液并進(jìn)行混合,利用程控孵育器(progarmmable block incubator)BI-526T(ASTEC公司),于37℃恒溫1h,繼而為了使酶失活,于75℃恒溫30min。將得到的溶液利用PCR purification kit(QIAGEN公司)進(jìn)行純化。在本試劑盒純化的最終階段,不使用本試劑盒附帶的洗脫緩沖液,而是利用25μl的TE緩沖液(pH8.0)將吸附于純化柱的DNA洗脫,得到高純度質(zhì)粒溶液。使用純化前后的具有第01片段的質(zhì)粒和具有第21片段的質(zhì)粒實施DNA電泳(Ultra Pure Agarose,Invitrogen公司)、確認(rèn)到已整合有目標(biāo)片段(單元DNA)(圖3)。
<具有單元DNA的質(zhì)粒的精密濃度調(diào)整和等摩爾整合>
再次用超微量吸光光度計測定得到的DNA溶液,求出高純度質(zhì)粒溶液的濃度。與理論上的最大值即200ng/μl相比,各試樣的濃度反映了粗提取質(zhì)粒溶液的純化程度,為約100ng/μl~200ng/μl的范圍?;跍y定結(jié)果將15μl各質(zhì)粒溶液取至1.5ml管,在各溶液中添加TE,使各質(zhì)粒的濃度成為100ng/μl,再次用超微量吸光光度計測定得到的高純度質(zhì)粒溶液,結(jié)果,相對于作為目標(biāo)值的100ng/μl,在百分之幾左右的范圍內(nèi)存在誤差,因此,針對各高純度質(zhì)粒,以小數(shù)點之后2位的μl的精度計算500ng的DNA的體積量,以該體積量(約5μl)分取各DNA溶液,根據(jù)之后用于切出的限制性內(nèi)切酶的種類(BbsI組、AarI組、BsmBI組)分別進(jìn)行整合,使各單元DNA的摩爾數(shù)大致相等。
<利用限制性內(nèi)切酶的等摩爾整合質(zhì)粒的一并切割>
關(guān)于整合的等摩爾質(zhì)粒溶液的總體積,BbsI組為約165μl,AarI 組為約45μl,BsmBI組為約40μl。對于各組添加2倍的滅菌水,分別得到495、135、120μl的高純度質(zhì)粒溶液,根據(jù)限制性內(nèi)切酶的種類,如下所述地進(jìn)行切割。
對于BbsI組而言,添加55μl 10×NEBbuffer#2和27.5μl限制性內(nèi)切酶BbsI(NEB公司),總計約577μl,于37℃反應(yīng)2h。對于AarI組而言,添加15μl限制性內(nèi)切酶附帶的10×Buffer_for_AarI、3μl同樣為限制性內(nèi)切酶附帶的用于激活切割的50×Oligoncleotide、7.5μl限制性內(nèi)切酶AarI(Thermo公司),總計約160μl,于37℃反應(yīng)2h。對于BsmBI組而言,添加13.3μl 10×NEBBuffer#3和6.3μl限制性內(nèi)切酶BsmBI(NEB公司),總計約140μl,于55℃反應(yīng)2h。經(jīng)過2h后,以不損害等摩爾的關(guān)系的方式從各試樣采集質(zhì)粒溶液,即,從BbsI組采集33μl,從AarI組采集9μl,從BsmBI組采集8μl,通過將其中5μl供于DNA電泳,確認(rèn)到質(zhì)粒被各限制性內(nèi)切酶切割(圖4)。
<利用瓊脂凝膠電泳的50個的單元DNA的一并分離和純化>
確認(rèn)后,對于各組添加等量的苯酚·氯仿·異戊醇(25:24:1)(Nacalai Tesque公司),通過充分混合使限制性內(nèi)切酶失活。此處,將各組的苯酚·氯仿·異戊醇(25:24:1)混合物整合至1個管中后,通過離心分離(20,000×g,10min)分離為苯酚相和水相,將水相(約900μl)回收至另一個1.5ml管中。對于水相添加500μl 1-丁醇(和光純藥工業(yè)公司),充分混合,通過離心分離(20,000×g,1min)分離,反復(fù)實施除去水分飽和的1-丁醇的操作,使水相的體積減少,直到水相的體積成為450μl以下。向其中添加50μl 3M乙酸鉀-乙酸緩沖液(pH5.2)和900μl乙醇,通過離心分離(20,000×g,10min),使DNA沉淀,將沉淀用70%乙醇洗滌后,溶解于20μl的TE中。向其中添加2μl用于電泳的10×Dye,使用0.7%的低熔點瓊脂凝膠(2-Hydroxyethyl Agarose TypeVII,Sigma公司),在1×TAE(Tris-Acetate-EDTA Buffer)緩沖液的存在下,利用通用瓊脂凝膠電泳裝置(i-MyRun.N核酸用電泳系統(tǒng),Cosmobio公司),施加35V (約2V/cm)的電壓,通過4h泳動將全部試樣中的第01~50片段和質(zhì)粒載體分離(圖5)。用100ml含有1μg/ml的溴化乙錠(Sigma公司)的1×TAE緩沖液將該電泳凝膠染色30min,通過用長波長的紫外線(366mn)照射實現(xiàn)可視化,用刀片切出第01~50片段形成的條帶(約1kb付近),回收至1.5ml管中。對于回收的低熔點瓊脂凝膠(約300mg)添加1×TAE緩沖液,使總體積約為700μl,通過將其于65℃恒溫10min,溶解凝膠。在得到的凝膠溶液中添加500μl的1-丁醇,通過離心分離(20,000×g,1min)將水相和丁醇相分離,反復(fù)舍棄水飽和丁醇,直到水相的體積成為450μl以下。在得到的液體中添加50μl的3M乙酸鉀-乙酸緩沖液(pH5.2)和900μl的乙醇,通過離心分離(20,000×g,1min)得到DNA的沉淀,將沉淀用70%乙醇洗滌后,溶解于20μl的TE中。取其中的1μl,用超微量吸光光度計測定濃度。
為了確認(rèn)尺寸分級分離前后的各組的摩爾數(shù),實施了定量PCR。圖6表示尺寸分級分離前后的各單元DNA的分子數(shù)的分布,圖7表示各單元DNA的分子數(shù)的變化率。由此,確認(rèn)到50個片段為大致等摩爾比率,并在未損害摩爾比的狀態(tài)下被回收。
<基因組裝>
第01~50片段的等摩爾混合物的DNA重量濃度為98ng/μl,總堿基序列為48,522bp,另一方面,載體DNA(pGETS118-AarI/AarI)為190ng/μl,全長為15,139bp?;谠撻L度的重量的比率,為了得到兩類DNA的等摩爾混合物,以相對于6.21μl第01~50片段的等摩爾混合物,載體DNA為1.00μl的比率進(jìn)行混合。在7.2μl得到的等摩爾混合溶液中添加8.2μl 2×連接緩沖液,將全部混合溶液于37℃恒溫5min后,添加1μl的T4DNA連結(jié)酶(Takara),于37℃恒溫4h。取其中一部分實施電泳,確認(rèn)到已經(jīng)連接(圖8)。采集其中8μl至新的管中,添加100μl枯草芽孢桿菌感受態(tài)細(xì)胞,使用旋轉(zhuǎn)混合器(duck rotor)于37℃旋轉(zhuǎn)培養(yǎng)30min。之后,添加300μl的LB培養(yǎng)基,使用旋轉(zhuǎn)混合器于37℃旋轉(zhuǎn)培養(yǎng)1h,然后,將培養(yǎng)液涂抹于含有10μg/ml的四環(huán)素的LB平板培養(yǎng)基,于37℃過夜培養(yǎng)。得到250個菌落。
<轉(zhuǎn)化體的質(zhì)粒結(jié)構(gòu)確認(rèn)>
隨機(jī)地選擇12株菌落,在2ml的含有10μg/ml的四環(huán)素的LB培養(yǎng)基中過夜培養(yǎng),為了增加內(nèi)部的質(zhì)粒的拷貝數(shù),以最終濃度為1mM的方式添加IPTG,進(jìn)一步于37℃培養(yǎng)3h。從得到的菌體中提取質(zhì)粒,利用限制性內(nèi)切酶HindIII和SfiI進(jìn)行雙酶切,通過電泳確認(rèn),結(jié)果,12株中的4株顯示了期望的切割模式(圖9)。對于該4株,利用氯化銫溴化乙錠密度梯度超離心法大量制備質(zhì)粒,用13種限制性內(nèi)切酶處理后,通過電泳確認(rèn)質(zhì)粒的結(jié)構(gòu),結(jié)果均與預(yù)想的片段一致(圖10)。此外,針對本質(zhì)粒的除了載體部分以外的所有區(qū)域確定堿基序列,結(jié)果,4株的質(zhì)粒均與預(yù)想堿基序列完全一致。
<組裝基因的功能確認(rèn)>
針對4株的質(zhì)粒,為了確認(rèn)其作為λ噬菌體的功能,如下文所述地進(jìn)行了噬斑形成能力的確認(rèn)。首先,利用λ末端酶(Lambda terminase,Epicenter公司)切割#3、#4、#6、#12的各組裝質(zhì)粒,從而將質(zhì)粒分割為載體和組裝基因部分,將其添加至λ包裝提取物(Gigapack III Plus Packaging Extract,Agilent Technologies公司)。感染大腸桿菌(VCS257株),涂抹于LB平板培養(yǎng)基,于37℃過夜培養(yǎng),結(jié)果確認(rèn)到噬斑。確認(rèn)到得到的噬斑的形狀與平行實施的、用TOYOBO公司制λ噬菌體DNA得到的噬斑的形態(tài)相同(圖11)。從利用各質(zhì)粒得到的噬斑中純化噬菌體DNA,通過用限制性內(nèi)切酶AvaI進(jìn)行切割來確認(rèn)是否存在導(dǎo)入的突變,結(jié)果,如圖12所示,顯示了與TOYOBO公司制λ噬菌體DNA不同的切割模式,確認(rèn)了與預(yù)想相同,所有的噬菌體中均存在AvaI位點。由此,確認(rèn)了將第01~50片段合計50個片段組裝制作而得的λ噬菌體基因組的堿基序列和噬斑形成能力均是完整的。
上述結(jié)果表明,能夠?qū)?gòu)成λ噬菌體DNA的50個單元DNA和載體DNA(pGETS118-AarI/AarI)合計51個DNA片段連結(jié)。
(實施例2、利用55個單元DNA及載體DNA的組裝的甲羥戊酸途徑人工操縱子的構(gòu)建)
對于類異戊二烯這種具有作為骨架的異戊二烯單體的物質(zhì),已知多種物質(zhì),而這些物質(zhì)均由異戊烯二磷酸酯(IPP)這一共通的材料合成。已知從糖酵解到IPP的途徑存在2個途徑,即,甲羥戊酸途徑和非甲羥戊酸途徑,雖然也存在單個生物中具有兩種途徑的生物,但大腸桿菌中僅存在非甲羥戊酸途徑。為了增強(qiáng)大腸桿菌的IPP生產(chǎn)能力,嘗試通過利用合成DNA片段進(jìn)行組裝,針對真核生物酵母的甲羥戊酸途徑的一部分基因構(gòu)建適應(yīng)大腸桿菌的密碼子使用頻率的人工基因。
<人工甲羥戊酸操縱子的序列設(shè)計>
嘗試基于大腸桿菌的密碼子使用頻率變換酵母的甲羥戊酸途徑的前半部分即乙酰CoA~甲羥戊酸的代謝途徑所需的3個基因(ERG10(1.2kb)、ERG13(1.5kb)、HMG1(3.2kb))的密碼子,制作將3個人工基因排列而成的人工操縱子(5,951bp)(序列號4)(但是,序列號4的全長為包含用于突出的4堿基的序列即5,955pb)。通過以下操作將酵母基因變換為大腸桿菌密碼子:在酵母的同義密碼子中,按照密碼子在酵母全部基因中的出現(xiàn)頻率排位,同樣地,在大腸桿菌的同義密碼子中按照在大腸桿菌全部基因中的出現(xiàn)頻率排位,將排位相同的密碼子互換。
<單元DNA的設(shè)計>
針對實施了同義密碼子變換的5,951bp的DNA序列,與實施例1同樣地檢索不切割該序列的限制性內(nèi)切酶位點,結(jié)果,判明了不存在限制性內(nèi)切酶AarI的識別序列,不會被AarI切割,因此,利用AarI制備了全部克隆。將全長5,951bp分割為55個的片段時,得到平均為108bp的片段,因此,將該大小作為理想分割單元,在該分割單元附近調(diào)查是否在全部理想分割單元中均出現(xiàn)了特定的序列(A和T總共2個、且C和G總共2個的共52種組合中除去8種回文組合后的44種組合(上述III組)、A和T總共1個、且C和G總共3個的共32種組合中不存在C和G三連排的共16種組合(上述IV組),2組共計為60種)中的任1種序列,結(jié)果,判明在距離理想分割單元±7bp的范圍內(nèi)出現(xiàn)了特定序列中的任一種。根據(jù)該結(jié)果,將全長分割為55個98~115bp的片段。表2是表示實施例2中的組裝DNA的分割單元及突出堿基序列的表。需要說明的是,對于甲羥戊酸基因群和基因組裝載體的分界,利用了僅由A和T構(gòu)成的突出(ATTA和AAAA)。
【表2】
<利用合成DNA的單元DNA的制作>
通過Rossi等人的方法(Rossi,J.J.,and Itakura,K.1982.J.Biol.Chem.257,9226-9229(1982)),利用2段80堿基的化學(xué)合成DNA制作分割而得的各片段。具體而言,使得2段化學(xué)合成DNA在3’末端有數(shù)十bp雜交,在5’末端附加識別位點,使得上述中設(shè)計的突出通過AarI消化出現(xiàn)在AarI切割位點的5’末端側(cè)。添加這2段合成DNA的雜交產(chǎn)物、和1種為了將隨后基于模板的延伸反應(yīng)而得的雙鏈單元DNA利用PCR法擴(kuò)增而制作成與兩個末端的AarI識別位點雜交的PCR引物(合計3種DNA),通過PCR反應(yīng)得到兩端具有AarI的切割位點的單元DNA,利用TA克隆法將該單元DNA 和大腸桿菌質(zhì)粒載體pMD19連結(jié),通過轉(zhuǎn)化克隆至大腸桿菌。通過將連結(jié)后的質(zhì)粒測序,針對各片段選擇具有期望的堿基序列的克隆。
<具有單元DNA的質(zhì)粒的等摩爾混合>
培養(yǎng)55株含有所得的期望的克隆的大腸桿菌,利用Plasmid mini-prep(QIAGEN公司)從各菌株中得到50μl粗提取質(zhì)粒溶液。從各所述溶液中分別取1μl,利用超微量吸光光度計測定DNA濃度,結(jié)果為82~180ng/μl。分別取約為5μg的質(zhì)粒,利用Plasmid Safe處理,在酶的熱失活后,利用Mini-elute PCR purification Kit(QIAGEN公司)純化,得到25μl的高純度質(zhì)粒溶液。將其中1μl利用超微量吸光光度計測定濃度,結(jié)果,濃度為108~213ng/μl。從各所得溶液中分別取20μl的高純度質(zhì)粒溶液至其他管中,在這些管中添加TE稀釋,使各質(zhì)粒的濃度在計算上為100ng/μl。再次用微量吸光光度計算出該純化質(zhì)粒溶液的濃度,基于該濃度以小數(shù)點后2位的μl的精度算出各高純度質(zhì)粒的重量為500ng時的體積量,從各質(zhì)粒溶液中分取該體積量(約5μl),集中于一個管中。在合計約275μl的等摩爾質(zhì)粒混合溶液中添加2倍體積的滅菌水、137.5μl的10×Buffer_for_AarI、67.5μl的限制性內(nèi)切酶AarI,于37℃過夜反應(yīng)。
<55個的單元DNA的一并尺寸分級分離>
在該反應(yīng)液中添加等量的苯酚·氯仿·異戊醇(25:24:1)使AarI失活后,進(jìn)行離心,通過乙醇沉淀將上清純化,并將沉淀溶解于20μl的TE。在該溶液中添加作為電泳用色素的二甲苯腈藍(lán),在2.5%瓊脂凝膠中,以TAE作為緩沖液,以100V、30分鐘實施電泳,從而將載體DNA即pMD19和插入基因即單元DNA分離(圖13)。用刀片分割泳動后的凝膠,將其中一部分用溴化乙錠染色,一邊確認(rèn)作為目標(biāo)的55個的等摩爾混合片段的條帶的位置,一邊從未染色的凝膠中切出目標(biāo)DNA的條帶。
<等摩爾單元DNA群的純化>
使用MiniElute Gel Extraction Kit(QIAGEN公司),如以下所述地操作,從得到的凝膠碎片中純化DNA。
通過測定凝膠的重量確定其體積后,添加體積為凝膠體積的15倍的CG Buffer,于50℃恒溫10min,從而溶解凝膠。在溶解的凝膠中,添加體積為凝膠的體積的5倍的異丙醇,將所得液體加入附帶的純化柱中,通過離心使DNA吸附于純化柱。對于該純化柱添加500μl的CG Buffer,通過離心清洗后,進(jìn)一步地,添加750μl PE Buffer,通過離心清洗。為了徹底地除去殘渣,進(jìn)行1次離心,對于該純化柱添加10μl的TE緩沖液,然后通過離心,得到摩爾數(shù)大致相等的55片段的單元DNA的混合溶液。
<對于等摩爾單元DNA混合溶液添加具有復(fù)制起點的DNA>
利用超微量吸光光度計測定該DNA濃度,結(jié)果為20ng/μl。平行制備的pGET151/AarI的濃度為67ng/μl,因此,考慮到二者長度的比率(5955bp:4306bp),將55片段的等摩爾混合溶液和pGETS151/AarI混合,使得二者的比率為4.63:1。
<基因組裝>
在5.63μl得到的等摩爾混合溶液中添加6.63μl 2×連接緩沖液,整體于37℃恒溫5min后,添加1μl的T4DNA連結(jié)酶(Takara)、于37℃恒溫4h。取一部分實施電泳,確認(rèn)單元DNA和載體DNA是否連接為串聯(lián)重復(fù)狀(圖14)。采集8μl連接后的溶液至另一管中,添加100μl枯草芽孢桿菌感受態(tài)細(xì)胞,使用旋轉(zhuǎn)混合器于37℃旋轉(zhuǎn)培養(yǎng)30min。之后,添加300μl的LB培養(yǎng)基,使用旋轉(zhuǎn)混合器于37℃旋轉(zhuǎn)培養(yǎng)1h后,將培養(yǎng)液涂抹于含有10μg/ml的四環(huán)素的LB平板培養(yǎng)基。
<轉(zhuǎn)化和組裝體的結(jié)構(gòu)確認(rèn)>
從得到的154個菌落中隨機(jī)地選擇24個克隆,接種于含有10μg/ml的四環(huán)素的LB。在對數(shù)增殖期添加IPTG使得最終濃度為1mM,培養(yǎng)至穩(wěn)定期后,提取質(zhì)粒DNA并用限制性內(nèi)切酶PvuII處理,通過電泳調(diào)查切割模式(圖15)。結(jié)果,確認(rèn)到2個克隆(#10和#20)與預(yù)想的堿基序列一致,因此,對于這些質(zhì)粒實施其他的限制性內(nèi)切酶處理,通過電泳確認(rèn)更詳細(xì)的結(jié)構(gòu),結(jié)果,所述質(zhì)粒與目標(biāo)結(jié)構(gòu)一致(圖16)。對該質(zhì)粒進(jìn)行測序,最終確認(rèn)克隆10和20具有與設(shè)計一致的堿基序列。
上述結(jié)果表明,能夠?qū)?gòu)成甲羥戊酸途徑人工操縱子的55個單元DNA和載體DNA(pGETS151-pBR)合計56個DNA片段連結(jié)。
由以上結(jié)果確認(rèn)到,根據(jù)本發(fā)明的DNA連結(jié)體的制作方法,能夠連結(jié)50個以上的DNA片段??梢哉J(rèn)為,之所以能夠這樣地連結(jié)多數(shù)的DNA片段,是因為在利用根據(jù)本發(fā)明的方法的制備方法制備的單元DNA組合物中,各單元DNA的摩爾數(shù)更準(zhǔn)確地接近于相同。
利用根據(jù)本發(fā)明的方法的制備方法制備的單元DNA組合物中,各單元DNA的摩爾數(shù)更準(zhǔn)確地接近于相同的理由推斷如下。
上述實施例1、2中,含有單元DNA的溶液中,測定各單元DNA的濃度時,各單元DNA連結(jié)有附加序列(具體而言,為環(huán)狀質(zhì)粒DNA)。于是,各種單元DNA之間,即使各堿基序列的長度的分布大,由于連結(jié)有附加序列,在測定溶液的濃度時,堿基序列的長度的分布相應(yīng)地減小。因此,基于測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差減少。因此,通過基于該測定結(jié)果分取各溶液,并將各溶液中的單元DNA的摩爾數(shù)調(diào)整為彼此相同,從而各溶液中的摩爾比容易接近于1,各單元DNA的摩爾數(shù)更準(zhǔn)確地接近于相等。
另外,實施例1中,單元DNA的各堿基長度和與各單元DNA連結(jié)的附加序列的堿基長度的合計總長度的分布的標(biāo)準(zhǔn)偏差為3691.4±6.6bp,相對于平均的總長度為±0.18%。實施例2中,單元DNA的各堿基長度和與各單元DNA連結(jié)的附加序列的堿基長度的合計總長度的分布的標(biāo)準(zhǔn)偏差為2828.2±4.5bp,相對于平均的總長度為±0.16%??梢哉J(rèn)為,實施例1、2中,如上所述,該標(biāo)準(zhǔn)偏差相對于平均的總長度的比率少,因此,基于溶液中的DNA的濃度的測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差更少。
關(guān)于與各單元DNA連結(jié)的附加序列的平均堿基長度相對于單元DNA的平均堿基長度的比,實施例1中為約2.7,實施例2中為約27。這樣,可以認(rèn)為,由于與各單元DNA連結(jié)的附加序列的平均堿基長度與單元DNA的平均堿基長度相比更長,因此,基于溶液中的DNA的濃度的測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差更少,基于溶液中的DNA的濃度的測定結(jié)果算出的各單元DNA的摩爾數(shù)的誤差更少。
另外,實施例1、實施例2中表明,因為DNA的設(shè)計是以位于將組裝DNA等分(以用所述組裝DNA的序列的堿基長度除以所述單元DNA的種類數(shù)時各段堿基長度相等的方式將所述組裝DNA等分)的位置的序列附近的非回文序列為界來進(jìn)行的,因此,這樣進(jìn)行單元DNA的設(shè)計時,各單元DNA的長度成為大致相同的長度。因此,利用限制性內(nèi)切酶除去附加序列后的電泳后的尺寸分級分離中,呈現(xiàn)位置大致相同的條帶,可以通過1次尺寸分級分離回收單元DNA,提高操作效率。
上述實施例1中,根據(jù)用于附加序列的除去的限制性內(nèi)切酶的種類分類為各組(實施例1中為3種,實施例2中為1種)。在除去工序前,可以將每個組的2種以上的含有單元DNA的溶液混合,不需要對每個單元DNA分別進(jìn)行限制性內(nèi)切酶處理,而是可以對于每個限制性內(nèi)切酶組一次性實施限制性內(nèi)切酶處理。即,由此確認(rèn)到DNA連結(jié)體的制作的操作效率提高。另外確認(rèn)到,即使使用這樣混合而得的溶液,也如上文所述,由于在摩爾數(shù)大致相等的狀態(tài)下混合,因此能夠連結(jié)多數(shù)的單元DNA。
(試驗例1枯草芽孢桿菌質(zhì)粒DNA的轉(zhuǎn)化中所需要的組裝單元DNA數(shù)的重復(fù)單元的冗余度(redundancy(r))的確認(rèn))
為了確認(rèn)枯草芽孢桿菌質(zhì)粒轉(zhuǎn)化中所需要的組裝單元DNA數(shù)的重復(fù)數(shù)量(冗余度)r,進(jìn)行了以下的試驗。
使用具有在枯草芽孢桿菌中有效的復(fù)制起點的質(zhì)粒pGETS118-t0-Pr-SfiI-pBR(序列號1),準(zhǔn)備以下的(A)~(H)的DNA。
<(A)的DNA的制備>
(A)的DNA是冗余度r=1的環(huán)狀單體質(zhì)粒DNA。首先,將pGETS118-t0-Pr-SfiI-pBR轉(zhuǎn)化至大腸桿菌中。從該轉(zhuǎn)化體中得到的質(zhì)粒主要為(A)的DNA,但包含一定量的多聚體(multimer),因此,為了除去所述多聚體,利用低熔點瓊脂凝膠電泳將該質(zhì)粒進(jìn)行DNA尺寸分級分離,僅切出單體質(zhì)粒DNA的區(qū)域的凝膠,進(jìn)行純化,由此,制備了(A)的DNA。
<(B)的DNA的制備>
(B)的DNA是冗余度r=1的線狀單體質(zhì)粒DNA。該(B)的DNA通過利用限制性內(nèi)切酶BlpI(識別位點為(5’-GC/TNAGC-3’))處理上述(A)的DNA來制備。
<(C)的DNA的制備>
(C)的DNA是冗余度r>1的串聯(lián)重復(fù)的線狀多聚體質(zhì)粒DNA。制備上述(B)的DNA時使用的BlpI在5’末端形成非回文的3堿基突出。由此,通過利用DNA連結(jié)酶將上述(B)的DNA連結(jié),制備了質(zhì)粒單元沿同一方向連續(xù)的線狀多聚體質(zhì)粒DNA,即(C)的DNA。
<(D)的DNA的制備>
(D)的DNA是冗余度r=1的線狀單體質(zhì)粒DNA。該(D)的DNA通過利用限制性內(nèi)切酶EcoRI(識別位點為(5’-G/AATTC-3’))處理上述(A)的DNA來制備。
<(E)的DNA的制備>
(E)的DNA是線狀多聚體質(zhì)粒DNA,其局部性地包含冗余度r>1的部分,由上述(D)的DNA以隨機(jī)的朝向連結(jié)而成。制備上述(D)的DNA時使用的EcoRI在5’末端形成回文的3堿基突出。將用EcoRI切割的質(zhì)粒DNA連結(jié),則可以制作質(zhì)粒單元以隨機(jī)的朝向連結(jié)而成的多聚體質(zhì)粒DNA。(E)的DNA通過利用DNA連結(jié)酶將上述(D)的DNA連結(jié)來制備。
<(F)的DNA的制備>
(F)的DNA是通過以下方法制備的r≒1的直鏈狀準(zhǔn)單體混合物:將用切割限制性內(nèi)切酶KasI僅切割(A)的DNA的1處并在去磷酸化后用其附近的BlpI切割而得的DNA片段、和用限制性內(nèi)切酶AfeI僅切割(A)的DNA的1處并在去磷酸化后用其附近的BlpI切割而得的DNA等量混合。該(F)的混合物中的任一種DNA片段的冗余度r均略低于1。
<(G)的DNA的制備>
(G)的DNA是冗余度r=1.98的線狀準(zhǔn)二聚體質(zhì)粒DNA,其通過利用DNA連結(jié)酶將上述(F)的2個DNA片段連結(jié),僅以BlpI位點指定方向性連結(jié)而成。
<(H)的DNA的制備>
上述(B)、(D)彼此的切割位點是分離的。(H)的DNA是將上述(B)和(D)的DNA以摩爾數(shù)相等的方式在不連結(jié)的狀態(tài)下混合而成的混合物。
<(A)~(H)的DNA對于枯草芽孢桿菌感受態(tài)細(xì)胞的轉(zhuǎn)化>
將上述(A)~(H)的DNA轉(zhuǎn)化至枯草芽孢桿菌感受態(tài)細(xì)胞中,以得到的四環(huán)素抗性株的出現(xiàn)數(shù)作為指標(biāo),求出每1μg的轉(zhuǎn)化體。無論是否進(jìn)行連接反應(yīng),均將(A)~(H)的DNA溶解于連接緩沖液中,用于轉(zhuǎn)化。(A)~(H)的DNA的電泳的照片如圖17所示,(A)~(H)的DNA的枯草芽孢桿菌感受態(tài)細(xì)胞的轉(zhuǎn)化體出現(xiàn)數(shù)如圖18所示。需要說明的是,圖17的電泳照片中,由于(C)和(E)的DNA在泳道上的廣范圍內(nèi)分布有各種大小的片段,因此,條帶變得不易辨別。另外,圖17的“G”中,上方的條帶為冗余度r=1.97的(G)的DNA,下方的條帶為(G)的DNA中混合的冗余度r=0.95的DNA。
根據(jù)上述結(jié)果,確認(rèn)到除了A的環(huán)狀DNA,能夠得到轉(zhuǎn)化體的僅有將DNA通過連接連結(jié)而成的(C)、(E)、(G)的DNA。由此表明,冗余度r=1、或r<1時,即使混合了2種切割位點不同、存在能補(bǔ)全切割位點的序列的關(guān)系的線狀質(zhì)粒分子,也無法得到轉(zhuǎn)化體,這說明,至少在線狀的DNA中,最低冗余度必須滿足r>1。
(模擬1連接模擬)
<連接模擬算法的設(shè)定>
使用表格計算軟件Excel(注冊商標(biāo))2007的VBA進(jìn)行模擬編程。使用3個參數(shù)Fi(Ni,Li,Ri)表現(xiàn)模擬連接中的DNA片段F。此處,“i”表示片段的識別號,更具體而言,表示Excel上的i列單元格?!癗”表示模擬連接中的1分子連接DNA片段中含有的單元DNA片段數(shù),“L”表示將連接產(chǎn)物的左側(cè)的突出末端的序列以任意的自然數(shù)數(shù)值化的結(jié)果,“R”與“L”同樣地表示將連接產(chǎn)物的右側(cè)的突出末端的序列以任意的自然數(shù)數(shù)值化的結(jié)果。此處,L=R時,2個突出序列為互補(bǔ)關(guān)系,將L=R定義為能夠連接的情況。連接的模擬實施如下。
對于Fi(Ni,Li,Ri)片段,用m(后述)乘以利用RAND()方法(method)生成的0~1之間的均勻隨機(jī)數(shù)(uniform random number),通過四舍五入取整數(shù),生成滿足i≠j的隨機(jī)數(shù)j,據(jù)此選擇Fj(Nj,Lj,Rj)片段。使用以下判斷式判斷這2個片段是否能夠連結(jié),能夠連結(jié)時,將片段的參數(shù)變更如下。
滿足Li=Rj時,即,F(xiàn)i的左末端和Fj的右末端能夠連結(jié)時,變換為Fi(new)(Ni(old)+Nj(old),Lj(old),Ri(old))片段和Fj(new)(0,0,0)片段。反之,滿足Ri=Lj時,即Fi片段的右末端和Fj片段的左末端能夠連結(jié)時,變換為Fi(new)(Ni(old)+Nj(old),Li(old),Rj(old))片段和Fj(new)(0,0,0)片段。Li≠Rj且Ri≠Lj時,為未變換的(Fi(new)(Ni(old),Li(old),Ri(old))片段和Fj(new)(Nj(old),Lj(old),Rj(old))片段),不發(fā)生模擬連接。對于模擬連接,將進(jìn)行至i=1→m為止的上述計算作為1個循環(huán)。此處,m是表示模擬連接循環(huán)中的DNA片段的總數(shù)的變數(shù),也表示在模擬的第1個循環(huán)的初始的單元DNA片段總數(shù)。計算1個模擬連接循環(huán)后,利用Excel2007的VBA命令的排序功能(Sort Method),變更Fi片段的排列使Li值成為降序,從而計數(shù)F(0,0,0)片段以外的Fi片段的總數(shù),將該總數(shù)作為新的m嵌入,進(jìn)行下一個循環(huán)的模擬連接。模擬連接循環(huán)進(jìn)行到不再存在具有互補(bǔ)關(guān)系的突出片段、無法繼續(xù)實施模擬連接的最小片段數(shù)mmin為止。此處,mmin值利用連接開始前的初始單元DNA片段的信息通過以下的計算求出。
mmin=(單元DNA片段總數(shù))―(具有滿足L=R的關(guān)系的2種單元DNA片段中較少的單元DNA片段數(shù)在整個體系中的總數(shù))
<連接模擬>
在組裝6片段、13片段、26片段、51片段為止的各組裝規(guī)模中,如下所述地制作模擬單元DNA片段群,其具有在0~20%的范圍內(nèi)以1%為刻度設(shè)定的變動系數(shù)(CV),相同單元DNA片段數(shù)的平均數(shù)為640。
利用Excel的均勻隨機(jī)數(shù)命令RAND(),生成相當(dāng)于各組裝規(guī)模的數(shù)量的0~1的隨機(jī)數(shù)群,將該隨機(jī)數(shù)群標(biāo)準(zhǔn)化,使平均值為0、方差為1,然后將各標(biāo)準(zhǔn)化隨機(jī)數(shù)乘以(片段平均值*CV(%)/100),將所得數(shù)值與片段數(shù)的平均值相加,由此,制作了各模擬單元DNA片段群。對于該隨機(jī)數(shù)群,針對各組裝規(guī)模的各CV(%)值制作20個獨立的群,并對各隨機(jī)數(shù)群實施上述模擬,模擬連接到mmin為止。將得到的20個各模擬連接片段整合,針對每個N值累計連接片段數(shù),求出(N值×連接片段數(shù))在用于連接的單元DNA片段總數(shù)中所占的比例,制作100%堆積圖,使N值大的分子的值位于下方。該圖表示于圖19。該圖19表示最終整合有初始的單元DNA片段的連接產(chǎn)物的大小的分布情況。圖19中,(a)是表示6片段組裝的圖表,(b)是表示13片段組裝的圖表,(c)是表示26片段的圖表,(d)是表示51片段組裝的圖表。6片段組裝的情況下,n=6、冗余度r=1、冗余度r<1的區(qū)域示于右上的區(qū)域。該結(jié)果顯示,6片段組裝中,在任何CV值的情況下,幾乎所有單元DNA片段都被整合至冗余度r>1區(qū)域的DNA片段中,反之,51片段組裝中,除了CV接近0%的區(qū)域,幾乎所有的區(qū)域都是冗余度小于1的區(qū)域。
<根據(jù)連接模擬導(dǎo)出連接理論式>
在根據(jù)上述的連接模擬的數(shù)值分析求出連接機(jī)制的一般式時,驗證了是否能夠算出各組裝規(guī)模的各CV值的連接產(chǎn)物的分布的擬合曲線。圖20表示在6片段組裝、平均640片段的情況下,CV=20%時連接產(chǎn)物的單元DNA片段含有數(shù)的分布。圖20中,各冗余度(0<r<1、1<r<2、2<r<5、5<r<10)的各柱形的圖案表示在將各冗余度的N除以r時歸類的成分(6片段組裝時,余數(shù)為0、1、2、3、4、5的6個成分中,除去由于N值為0而不能轉(zhuǎn)換為對數(shù)的余數(shù)為0的成分,為5成分)的種類,不同的冗余度中,相同圖案的柱表示用N除以r時被歸類的成分為同一種類。另外,圖20的圖表中的線性近似曲線針對各類圖案的成分求出。
各N值的連接產(chǎn)物的分子數(shù)的柱形圖在整體上顯示了分子數(shù)指數(shù)伴隨N值增加指數(shù)式減少的趨勢,初步觀察,可見近似于作為離散型概率分布之一的幾何分布。然而,該柱形圖在微觀上顯示了以基因組裝的規(guī)模數(shù)或1冗余度(6片段組裝時即為6)為周期的周期性結(jié)構(gòu),特別地,在N值相當(dāng)于基因組裝規(guī)模的整數(shù)倍的部分,顯示了完全不出現(xiàn)片段的特征性結(jié)構(gòu)。該特征與幾何分布或視為連續(xù)型概率分布時的指數(shù)分布不完全一致。但是,將表示連接產(chǎn)物分子數(shù)的軸變換為對數(shù)刻度,并分別從各周期中提取其微觀性周期結(jié)構(gòu)的各成分(即,根據(jù)N除以組裝規(guī)模即6而得的余數(shù)歸類的成分)并求出線性近似曲線后,顯示出極高的相關(guān)系數(shù)的平方值(0.94以上),因此,可以認(rèn)為各成分即使接近指數(shù)分布也沒有問題。除了圖20所示的6片段組裝、濃度差異CV為20%的例子以外,在其他的組裝規(guī)模及其他的CV值的例子中也確認(rèn)到了該分布。之后,將本機(jī)制啟發(fā)式地假定為能夠接近指數(shù)分布,進(jìn)行對于指數(shù)分布函數(shù)(f(n)=λ*exp(-λ*n))的擬合。
具體而言,(1)首先,在上述的各組裝規(guī)模的全部模擬中,針對根據(jù)將N除以組裝規(guī)模而得的余數(shù)歸類的各成分,利用約3周期的經(jīng)過對數(shù)變換的分子數(shù)值通過線性近似得到直線,求出該直線的斜率,作為-λ,并根據(jù)該值算出λ。(2)接著,在指數(shù)分布函數(shù)中,參數(shù)λ的倒數(shù)即1/λ為f(N)的平均值,因此,求出20個隨機(jī)數(shù)群中的連接產(chǎn)物的N值的平均值,根據(jù)該平均值的倒數(shù)算出各CV(%)的λ(CV(%))。將單元DNA片段的濃度差異的CV(%)值設(shè)定為橫軸,將λ值設(shè)定為縱軸,針對上述(1)及(2)的結(jié)果描點(plot),確認(rèn)到無論基因組裝規(guī)模如何,所有描點均存在于通過某原點的正比例直線上。根據(jù)這些描點求出各自的線性近似曲線,將圖表示于圖21。圖1中,(a)是表示根據(jù)上述(1)的3周期求得的斜率λ和單元DNA片段的濃度的差異的關(guān)系的圖表,(b)是表示由上述(2)的N值的平均值的倒數(shù)求得的λ和單元DNA片段的濃度的差異的關(guān)系的圖表。根據(jù)精度更高的(2)得到的該線性近似曲線的一般式為f(N)=0.0058*CV(%)*exp(-0.0058*CV(%)*N)。另外,由圖21可見,λ=0.0058*CV(%)呈現(xiàn)出高達(dá)0.99的相關(guān)系數(shù)平方值,為高相關(guān)性。因此,確認(rèn)了該一般式?jīng)]有問題。
<連接的反應(yīng)速度的定性分析>
上述的連接模擬中,假設(shè)了正規(guī)的突出組合之間的連接全部完成的狀態(tài)。對此,為了研究實際組裝基因時的連接反應(yīng)條件與模擬的反應(yīng)條件的近似程度,調(diào)查了連接反應(yīng)的動力學(xué)(kinetics)。
首先,使用λ噬菌體重建的51片段連結(jié),在以實際基因組裝條件下進(jìn)行的連接反應(yīng)中,于各種反應(yīng)時間對連接產(chǎn)物進(jìn)行取樣,對于全部51個連結(jié)位點進(jìn)行定性分析,調(diào)查連結(jié)實際進(jìn)行的程度。用于連接的單元DNA片段的平均濃度為約0.2fmol/μl,從該單元DNA片段的溶液中添加T4DNA連結(jié)酶開始,于37℃反應(yīng)0、1.25、2.5、5、10、20、40、80、160、320分鐘后,采集各反應(yīng)溶液的一部分,使用被設(shè)計為能夠擴(kuò)增跨越被正規(guī)地連結(jié)的2個單元DNA片段的連結(jié)部分的DNA的定量PCR用引物組和被設(shè)計為僅能夠擴(kuò)增各單元DNA片段內(nèi)部的定量PCR用引物組,并用限制性內(nèi)切酶切割市售的λ噬菌體基因組DNA(東洋紡)或已構(gòu)建的組裝質(zhì)粒,以直鏈化的DNA的稀釋系列作為指標(biāo),調(diào)查各片段的連接的進(jìn)展程度。結(jié)果,確認(rèn)到在本反應(yīng)條件下,在任一連結(jié)部分,連接均在約10分鐘結(jié)束,而在實際為4小時(240分鐘)的反應(yīng)時間內(nèi),連接幾乎徹底完成。另外,經(jīng)過充足的時間后(40分鐘以后),幾乎所有的連結(jié)點的反應(yīng)程度以相對于以各單元DNA片段中較少的片段為基準(zhǔn)得到的值約為1的比例存在,因此,確認(rèn)到被連接的DNA片段幾乎均分別與正確的連結(jié)對象連結(jié)。
<錯誤連接比例的推測>
為了更詳細(xì)地確認(rèn)連接的狀況,在上述的λ噬菌體基因組重建的實驗中得到的組裝體中,針對除了完全確定了全堿基序列的#3、#4、#6、#12以外的全部克隆(#1、#2、#5、#7、#8、#9、#10、#11)確定堿基序列,由此確定以錯誤的組合連接的位置。各克隆的錯誤連接位點如圖22所示。根據(jù)該結(jié)果,確認(rèn)到在除了#11克隆以外的7克隆的內(nèi)部存在1個或2個的錯誤連接,并確定了全部錯誤連接。另一方面,對于#11克隆,在組裝DNA內(nèi)確認(rèn)到重復(fù)存在相同的單元DNA片段,雖然無法進(jìn)行徹底的結(jié)構(gòu)確認(rèn),但確認(rèn)到共存在6處錯誤連接位點。#11的詳細(xì)的單元DNA片段數(shù)不詳,因此,計算除了#11以外的全部克隆的錯誤連接出現(xiàn)頻率,結(jié)果,確認(rèn)以大約為46個連結(jié)點中有1個的比例存在錯誤連接,即,錯誤連接以約2.2%這樣的較低比例出現(xiàn)。該結(jié)果與上述的定量PCR的結(jié)果并不矛盾。
<實際的連接產(chǎn)物的大小分布與模擬的一致性的驗證>
基于上述錯誤連接比例的推測和連接的反應(yīng)速度的定性分析這2個驗證,推測在實際的連接反應(yīng)中,經(jīng)過4小時這樣充分的時間后,連接幾乎全部完成,另外,錯誤連接發(fā)生的概率少。于是,對于初始單元DNA片段存在濃度差異的實際的單元DNA片段群,通過以下的方法驗證是否能夠利用模擬預(yù)測實際的連接產(chǎn)物的大小分布。
首先,作為材料,使用了用于λ噬菌體基因組重建實驗的、通過定量PCR觀測到單元DNA片段濃度的差異CV為7.5%的群。該定量PCR的觀測值包含數(shù)值為CV=3.6%的測定誤差,因此,推測真實的單元DNA片段的差異的CV可能低于CV=7.5%。因此,利用模擬求出可能為真實數(shù)值的CV,結(jié)果,推測真實的CV為6.6%時,由于測定誤差CV=3.6%,觀測值可能為CV=7.5%。于是,將該群的真實的單元DNA片段的差異設(shè)為CV=6.6%,由RAND()方法生成平均640條片段,對于滿足CV=6.6%的條件的51種初始單元DNA片段進(jìn)行連接的模擬。在該模擬中,除了表示100%的反應(yīng)比例的mmin,針對連接效率為95%、96%、97%、98%、99%的連接時的m值也分別準(zhǔn)備了100個獨立的隨機(jī)數(shù)群,持續(xù)反應(yīng)直到達(dá)到各自指定的m值。將100個群的所得連接產(chǎn)物的分布整合,利用F(N,L,R)的參數(shù),以bp為單位,求出單元DNA片段各模擬連接產(chǎn)物的DNA的長度。接著,對于存在片段數(shù)的差異為CV=6.6%的、實際的λ噬菌體基因組重建實驗的單元DNA片段群,如上述“連接的反應(yīng)速度的定性分析”所述,于37℃反應(yīng)4小時,反應(yīng)后,利用CHEF型脈沖場凝膠電泳裝置(BIO CRAFT公司制),在0.5×TBE、5V/cm、30sec周期的泳動條件下泳動16小時,調(diào)查DNA的實際的分子量分布。該電泳的照片示于圖23。利用NIHimage軟件得到的電泳照片的DNA密度分布,將得到的圖與通過模擬得到的各連接效率的預(yù)想DNA分布圖重疊并進(jìn)行比較。結(jié)果如圖24所示。根據(jù)圖24,確認(rèn)到在連接效率為98%-100%的情況下,通過電泳得到的DNA的分子量分布與預(yù)想DNA分布圖大致一致,特別地,呈現(xiàn)最大濃度的數(shù)值最大的分子量與連接效率為98%的結(jié)果良好地一致。由此可見,模擬的結(jié)果能夠基本全面地重現(xiàn)通過4小時連接反應(yīng)幾乎完成全部連接、錯誤連接以約2%的比率發(fā)生的連接的情況。
<連接模擬的一般化>
實際情況下,用于組裝的單元DNA片段無法避免濃度的差異,為了總結(jié)實際上必須將單元DNA片段的濃度的差異控制為怎樣的水平,根據(jù)上述求出的一般式f(N)=0.0058*CV(%)*exp(-0.0058*CV(%)*N)制圖,示于圖25。在當(dāng)前的基因組裝實驗中,DNA濃度的差異約為CV(%)=6.6,而由圖25可知,CV(%)=6.6時,51個片段的組裝中,使用的單元DNA片段的約40%被整合入r值大于1的連接產(chǎn)物。另外,由圖25可知,假如利用2倍的組裝規(guī)模即102片段的群規(guī)劃新的基因組裝時,如果期望與51個片段相同程度的組裝效率,則需要實現(xiàn)CV(%)=3.3。另外,使用一般式f(N)=0.0058*CV(%)*exp(-0.0058*CV(%)*N),求出了單元DNA片段的濃度的差異和1種連接產(chǎn)物的平均單元DNA片段數(shù)的關(guān)系。其結(jié)果示于圖26。由此可見,通過使用一般式f(N)=0.0058*CV(%)*exp(-0.0058*CV(%)*N),能夠根據(jù)CV(%)值容易地推測1條連接產(chǎn)物中的平均單元DNA片段含有數(shù)。