本發(fā)明涉及基因合成技術(shù)領(lǐng)域,具體涉及一種高效合成融合基因的方法及其應(yīng)用。
背景技術(shù):
當(dāng)前基因合成主要的方法為兩步合成法,第一步是利用pcr(聚合酶鏈?zhǔn)椒磻?yīng))的方法將引物拼接形成200~800bp(堿基對)的小片段,經(jīng)過測序驗(yàn)證無誤后通過將片段拼接成更長的所需片段。常用的將小片段拼接成長片段的方法有連接法,重疊pcr方法,體外重組法等。目前應(yīng)用最廣泛的是重疊pcr的方法。在該方法中,兩個需要拼接的片段有一個重疊區(qū),可以用于重疊pcr反應(yīng)時的退火。而在片段的另外兩端分別設(shè)計擴(kuò)增全長的引物,在pcr反應(yīng)體系中,一個片段將可以利用另外一個片段作為模板延伸,從而得到拼接后的全長的片段序列,而最后擴(kuò)增全長的引物將整個的全長片段進(jìn)行擴(kuò)增得到足夠量以進(jìn)行后續(xù)的克隆工作。
重疊pcr反應(yīng)的成功與否是得到全長拼接片段的關(guān)鍵。由于目前對重疊pcr反應(yīng)的影響因素并沒有系統(tǒng)的研究與優(yōu)化,因此重疊反應(yīng)在日常拼接中的成功率并不高,大約在80%左右。而大部分的優(yōu)化集中在對重疊pcr反應(yīng)體系的改變上面。比如使用不同供應(yīng)商、不同特性的聚合酶;在反應(yīng)的緩沖液體系中加入不同濃度的鎂離子;使用不同對的退火溫度等。這些方法沒有一個明確的指導(dǎo)原則,沒有明確的優(yōu)化參數(shù)可以進(jìn)行方向性的判斷,基本上是一個試錯的過程,因而費(fèi)時費(fèi)力。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種合成融合基因的方法,包括如下步驟:s1:分析待合成融合的基因序列,確定適合進(jìn)行退火的區(qū)域;s2:在適合進(jìn)行退火的區(qū)域中選擇合適長度的片段,進(jìn)行各個片段的引物的設(shè)計與合成;s3:混合合成的各個片段的引物,然后進(jìn)行重疊pcr,將各個片段的引物拼接成,得到拼接產(chǎn)物。需要說明的是,s3中,引物分離純化后可以進(jìn)行克隆測序后驗(yàn)證。為了提高片段之間的退火效率,從而提高片段的拼接成功率,本發(fā)明針對影響退火的序列進(jìn)行了分析、結(jié)合pcr引物的設(shè)計原則來優(yōu)化片段的分段原則。從pcr引物的設(shè)計原則借鑒中發(fā)現(xiàn)以下因素同樣影響待拼接片段之間的重疊區(qū)域的有效性:(1)堿基的比例,也就是重疊區(qū)中at與gc的比例,理想的情況下保持at與gc的比例在接近1:1有利于片段的退火;(2)區(qū)域中復(fù)雜的二級結(jié)構(gòu)區(qū)域,包括回文區(qū)與重復(fù)區(qū)域等,這些復(fù)雜二級結(jié)構(gòu)影響有效的退火;(3)存在過多的連續(xù)堿基,比如類似aaaaaaaa等的連續(xù)區(qū)域。目前該領(lǐng)域的多種常用分子生物學(xué)軟件均能分析目的序列并能發(fā)現(xiàn)以上的這些序列特征,比如primer3、oligo、dnastar等商業(yè)化或開源的免費(fèi)工具,均能用于發(fā)現(xiàn)上述不利的序列因素,從而在后續(xù)的拼接片段分段中通過項(xiàng)目設(shè)計者來主動避免,因而有效避免了以往的無指導(dǎo)分段的弊端。
在本發(fā)明的進(jìn)一步實(shí)施方式中,s1中,確定適合進(jìn)行退火的區(qū)域是根據(jù)退火溫度確定,退火溫度為60℃。需要說明的是,退火的區(qū)域可以根據(jù)需要的tm(退火溫度)決定,通常認(rèn)為最佳的tm為55℃~60℃。
在本發(fā)明的進(jìn)一步實(shí)施方式中,s1中,確定適合進(jìn)行退火的區(qū)域是根據(jù)primer3、oligo或dnastar等工具進(jìn)行確定。
在本發(fā)明的進(jìn)一步實(shí)施方式中,s2中,合適長度為200~800bp,且保證各片段之間的重疊區(qū)域?yàn)檫m合進(jìn)行退火的區(qū)域。需要說明的是,根據(jù)適合區(qū)域在片段中的位置,選擇合適的長度,注意保持該長度在適合的第一步合成的片段長度范圍之內(nèi),比如(200~800bp),保證各片段之間的重疊區(qū)域?yàn)樯鲜鲞x擇出的合適退火區(qū),然后按照常規(guī)方法進(jìn)行各個片段引物的設(shè)計。
在本發(fā)明的進(jìn)一步實(shí)施方式中,在s3后,還包括s4:將拼接產(chǎn)物進(jìn)行克隆,測序驗(yàn)證序列正確性。
在本發(fā)明的進(jìn)一步實(shí)施方式中,s3中,重疊pcr采用lifetechnologies公司的platinumhifi聚合酶及反應(yīng)體系,當(dāng)然其它供應(yīng)商的類似高保真聚合酶也可使用。
本發(fā)明還保護(hù)上述合成融合基因的方法在高通量測序基因診斷中融合基因標(biāo)準(zhǔn)品構(gòu)建中的應(yīng)用。
本發(fā)明還保護(hù)上述合成融合基因的方法在基因定量分析中融合基因的標(biāo)準(zhǔn)品構(gòu)建中的應(yīng)用。
本發(fā)明還保護(hù)上述合成融合基因的方法在工程抗體尤其是雙特異性抗體構(gòu)建中的應(yīng)用。
本發(fā)明還保護(hù)上述合成融合基因的方法在多個編碼序列的融合基因表達(dá)載體的構(gòu)建中的應(yīng)用。
本發(fā)明還保護(hù)上述合成融合基因的方法在編碼序列與調(diào)控元件的融合基因的構(gòu)建中的應(yīng)用。
本發(fā)明還保護(hù)上述合成融合基因的方法在較長基因的合成中的應(yīng)用。
本發(fā)明提供的技術(shù)方案,具有如下的有益效果:(1)申請人經(jīng)過長期的研究發(fā)現(xiàn),目前應(yīng)用的重疊pcr方法成功率不高的原因是沒有針對待拼接片段之間的退火進(jìn)行優(yōu)化,在片段之間沒有快速、高比率的退火形成之后進(jìn)行pcr會嚴(yán)重影響全長片段的形成,且目前沒有已知的方法針對待拼接片段的分段,優(yōu)化重疊片段之間的退火來提高重疊pcr反應(yīng)的效率;本發(fā)明針對提高重疊片段的退火效率提出了有目的地進(jìn)行合適長度的分段,設(shè)計小片段之間的重疊區(qū)來提高退火效率,從而提高重疊pcr的成功率;(2)本發(fā)明可以避免現(xiàn)有技術(shù)選取拼接片段的盲目狀況,而是精確選取最佳的分段,因而對于后期的重疊pcr的擴(kuò)增成功率具有突破性的提高,現(xiàn)有的重疊pcr的一次成功率大致在70%~80%左右,而采用本發(fā)明提供的方法成功率能高達(dá)100%;且由于一次成功率的大大提高,本發(fā)明免去了需要多次嘗試pcr條件、改變反應(yīng)體系中離子強(qiáng)度和添加劑、反應(yīng)溫度等繁瑣的優(yōu)化步驟,大大降低了試劑與人力成本。
本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例,對本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
下述實(shí)施例中的實(shí)驗(yàn)方法,如無特殊說明,均為常規(guī)方法。下述實(shí)施例中所用的試驗(yàn)材料,如無特殊說明,均為自常規(guī)生化試劑商店購買得到的。以下實(shí)施例中的定量試驗(yàn),均設(shè)置三次重復(fù)實(shí)驗(yàn),數(shù)據(jù)為三次重復(fù)實(shí)驗(yàn)的平均值或平均值±標(biāo)準(zhǔn)差。
實(shí)施例
本實(shí)施例以合成基因水稻的mtp2基因?yàn)槔瑏磉M(jìn)一步說明本發(fā)明提供的合成融合基因的方法。
水稻的mtp2基因序列為(seqidno:1):atgggcttccgcctcgcccacctcgccgcctgcgtggcccgcgccgcggcctcctcctcccgcctccgggggccacgccccgccgcctccgcgctcgtcgcccctctcctcgcctcgccgtgggagccgagcggcggcggccagccgcactggctcgtcccctcccgcggccacgtgggccactcccaccaccaccaccacggcgaggaggtggggggcgaggcgtcggagaggatcttccggctggggctcgcggccgacgtcgtcctcaccgtcgggaaggccgtcaccggctacctctccggcagcaccgcgatcgccgccgacgccgctcactccctctccgacattgtgctgagcggggtggctctgctgtcgtacaaggcggccaaggctcccagagacaaggagcatccgtatggtcatggaaagtttgagagtttaggagctcttggaatttcaagtatgttattagttactgcaggtgggattgcctggcatgcttttgacgttcttcagggagttatgtcttctgctccagatattattggcaatgtatcgcatgctcatcatagccatggtagcagtgggcatcaccatggaatagatttggaacatccaatccttgcattgagtgtgacagcttttgcaatatctgtcaaagaagggctctattggatcacaaaaagagctggagaaaaggaagggagcgggctgatgaaagctaatgcatggcaccatcgctcagatgctatttcttctgttgttgccctattaggggtaggtggctccattcttggagttccttatcttgatccactagctggacttgttgtctcgggcatgattcttaaagctggtgttcatactggatatgagagtgtgctggaactagttgatgcagctgtggatccatcgcttctacaaccaatcaaggaaacaattttgcaggttgatggtgtaaagggatgccatcggttgaggggaagaaaagctgggacctccttatatcttgatgtacacattgaggtatatcctttcttaagtgtcagtgcagcacatgatattggggagactgtccgtcatcaaatacaaaagtcacacaatcaagttgctgaggttttcatacacataggtagcctgcaacctttaaaccagaatgctctctaa。
本實(shí)施例把待合成的大片段用軟件primer3分析后,分為以下片段f1,f2等。根據(jù)primer3的分析結(jié)果,選取的重疊區(qū)為:tcccagagacaaggagcatc。
把該片段分成兩段分別進(jìn)行pcr后,再進(jìn)行重疊pcr的拼接。
第一段f1(seqidno:2):atgggcttccgcctcgcccacctcgccgcctgcgtggcccgcgccgcggcctcctcctcccgcctccgggggccacgccccgccgcctccgcgctcgtcgcccctctcctcgcctcgccgtgggagccgagcggcggcggccagccgcactggctcgtcccctcccgcggccacgtgggccactcccaccaccaccaccacggcgaggaggtggggggcgaggcgtcggagaggatcttccggctggggctcgcggccgacgtcgtcctcaccgtcgggaaggccgtcaccggctacctctccggcagcaccgcgatcgccgccgacgccgctcactccctctccgacattgtgctgagcggggtggctctgctgtcgtacaaggcggccaaggctcccagagacaaggagcatc。
第二段f2(seqidno:3):tcccagagacaaggagcatccgtatggtcatggaaagtttgagagtttaggagctcttggaatttcaagtatgttattagttactgcaggtgggattgcctggcatgcttttgacgttcttcagggagttatgtcttctgctccagatattattggcaatgtatcgcatgctcatcatagccatggtagcagtgggcatcaccatggaatagatttggaacatccaatccttgcattgagtgtgacagcttttgcaatatctgtcaaagaagggctctattggatcacaaaaagagctggagaaaaggaagggagcgggctgatgaaagctaatgcatggcaccatcgctcagatgctatttcttctgttgttgccctattaggggtaggtggctccattcttggagttccttatcttgatccactagctggacttgttgtctcgggcatgattcttaaagctggtgttcatactggatatgagagtgtgctggaactagttgatgcagctgtggatccatcgcttctacaaccaatcaaggaaacaattttgcaggttgatggtgtaaagggatgccatcggttgaggggaagaaaagctgggacctccttatatcttgatgtacacattgaggtatatcctttcttaagtgtcagtgcagcacatgatattggggagactgtccgtcatcaaatacaaaagtcacacaatcaagttgctgaggttttcatacacataggtagcctgcaacctttaaaccagaatgctctctaa。
按照常規(guī)的基因合成流程,將上述兩段分別合成小寡聚核苷酸片段,然后擴(kuò)增分別得到用于拼接片段。將片段分離純化后,定量取出20ng再用于重疊pcr中,使用如下擴(kuò)增引物對:
opf(seqidno:4):5’-atgggcttccgcctcgcccac-3’;
opr(seqidno:5):5’-ttagagagcattctggtttaaaggttg-3’。
重疊pcr的擴(kuò)增反應(yīng)條件為:95℃,3min初始,隨后95℃,45秒;55℃,45秒,72℃60秒。重疊pcr采用lifetechnologies公司的platinumhifi聚合酶及反應(yīng)體系。
將擴(kuò)增產(chǎn)物進(jìn)行電泳鑒定,發(fā)現(xiàn)在1.2kb左右有明顯的擴(kuò)增條帶,經(jīng)過ta克隆之后,測序驗(yàn)證發(fā)現(xiàn)與上述目的序列完全一致,因此上述合成成功。
現(xiàn)有技術(shù)由于對于重疊pcr拼接這一步?jīng)]有明確的指導(dǎo)原則,因此基本上按照長度來大致劃分拼接的子片段,在本實(shí)施例中,該方法無法得到全長的序列或者序列中含有點(diǎn)突變,需要再次糾錯才能得到正確的基因片段。
本發(fā)明提供的技術(shù)方案,具有如下的有益效果:(1)申請人經(jīng)過長期的研究發(fā)現(xiàn),目前應(yīng)用的重疊pcr方法成功率不高的原因是沒有針對待拼接片段之間的退火進(jìn)行優(yōu)化,在片段之間沒有快速、高比率的退火形成之后進(jìn)行pcr會嚴(yán)重影響全長片段的形成,且目前沒有已知的方法針對待拼接片段的分段,優(yōu)化重疊片段之間的退火來提高重疊pcr反應(yīng)的效率;本發(fā)明針對提高重疊片段的退火效率提出了有目的地進(jìn)行合適長度的分段,設(shè)計小片段之間的重疊區(qū)來提高退火效率,從而提高重疊pcr的成功率;(2)本發(fā)明可以避免現(xiàn)有技術(shù)選取拼接片段的盲目狀況,而是精確選取最佳的分段,因而對于后期的重疊pcr的擴(kuò)增成功率具有突破性的提高,現(xiàn)有的重疊pcr的一次成功率大致在70%~80%左右,而采用本發(fā)明提供的方法成功率能高達(dá)100%;且由于一次成功率的大大提高,本發(fā)明免去了需要多次嘗試pcr條件,改變反應(yīng)體系中離子強(qiáng)度、添加劑,反應(yīng)溫度等繁瑣的優(yōu)化步驟,大大降低了試劑與人力成本。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對步驟、數(shù)字表達(dá)式和數(shù)值并不限制本發(fā)明的范圍。在這里示出和描述的所有示例中,除非另有規(guī)定,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制,因此,示例性實(shí)施例的其他示例可以具有不同的值。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的保護(hù)范圍當(dāng)中。
sequencelisting
<110>上海恩即斯生物科技有限公司
<120>高效合成融合基因的方法及其應(yīng)用
<130>3
<160>5
<170>patentinversion3.3
<210>1
<211>1170
<212>dna
<213>人工合成
<400>1
atgggcttccgcctcgcccacctcgccgcctgcgtggcccgcgccgcggcctcctcctcc60
cgcctccgggggccacgccccgccgcctccgcgctcgtcgcccctctcctcgcctcgccg120
tgggagccgagcggcggcggccagccgcactggctcgtcccctcccgcggccacgtgggc180
cactcccaccaccaccaccacggcgaggaggtggggggcgaggcgtcggagaggatcttc240
cggctggggctcgcggccgacgtcgtcctcaccgtcgggaaggccgtcaccggctacctc300
tccggcagcaccgcgatcgccgccgacgccgctcactccctctccgacattgtgctgagc360
ggggtggctctgctgtcgtacaaggcggccaaggctcccagagacaaggagcatccgtat420
ggtcatggaaagtttgagagtttaggagctcttggaatttcaagtatgttattagttact480
gcaggtgggattgcctggcatgcttttgacgttcttcagggagttatgtcttctgctcca540
gatattattggcaatgtatcgcatgctcatcatagccatggtagcagtgggcatcaccat600
ggaatagatttggaacatccaatccttgcattgagtgtgacagcttttgcaatatctgtc660
aaagaagggctctattggatcacaaaaagagctggagaaaaggaagggagcgggctgatg720
aaagctaatgcatggcaccatcgctcagatgctatttcttctgttgttgccctattaggg780
gtaggtggctccattcttggagttccttatcttgatccactagctggacttgttgtctcg840
ggcatgattcttaaagctggtgttcatactggatatgagagtgtgctggaactagttgat900
gcagctgtggatccatcgcttctacaaccaatcaaggaaacaattttgcaggttgatggt960
gtaaagggatgccatcggttgaggggaagaaaagctgggacctccttatatcttgatgta1020
cacattgaggtatatcctttcttaagtgtcagtgcagcacatgatattggggagactgtc1080
cgtcatcaaatacaaaagtcacacaatcaagttgctgaggttttcatacacataggtagc1140
ctgcaacctttaaaccagaatgctctctaa1170
<210>2
<211>415
<212>dna
<213>人工合成
<400>2
atgggcttccgcctcgcccacctcgccgcctgcgtggcccgcgccgcggcctcctcctcc60
cgcctccgggggccacgccccgccgcctccgcgctcgtcgcccctctcctcgcctcgccg120
tgggagccgagcggcggcggccagccgcactggctcgtcccctcccgcggccacgtgggc180
cactcccaccaccaccaccacggcgaggaggtggggggcgaggcgtcggagaggatcttc240
cggctggggctcgcggccgacgtcgtcctcaccgtcgggaaggccgtcaccggctacctc300
tccggcagcaccgcgatcgccgccgacgccgctcactccctctccgacattgtgctgagc360
ggggtggctctgctgtcgtacaaggcggccaaggctcccagagacaaggagcatc415
<210>3
<211>775
<212>dna
<213>人工合成
<400>3
tcccagagacaaggagcatccgtatggtcatggaaagtttgagagtttaggagctcttgg60
aatttcaagtatgttattagttactgcaggtgggattgcctggcatgcttttgacgttct120
tcagggagttatgtcttctgctccagatattattggcaatgtatcgcatgctcatcatag180
ccatggtagcagtgggcatcaccatggaatagatttggaacatccaatccttgcattgag240
tgtgacagcttttgcaatatctgtcaaagaagggctctattggatcacaaaaagagctgg300
agaaaaggaagggagcgggctgatgaaagctaatgcatggcaccatcgctcagatgctat360
ttcttctgttgttgccctattaggggtaggtggctccattcttggagttccttatcttga420
tccactagctggacttgttgtctcgggcatgattcttaaagctggtgttcatactggata480
tgagagtgtgctggaactagttgatgcagctgtggatccatcgcttctacaaccaatcaa540
ggaaacaattttgcaggttgatggtgtaaagggatgccatcggttgaggggaagaaaagc600
tgggacctccttatatcttgatgtacacattgaggtatatcctttcttaagtgtcagtgc660
agcacatgatattggggagactgtccgtcatcaaatacaaaagtcacacaatcaagttgc720
tgaggttttcatacacataggtagcctgcaacctttaaaccagaatgctctctaa775
<210>4
<211>21
<212>dna
<213>人工合成
<400>4
atgggcttccgcctcgcccac21
<210>5
<211>27
<212>dna
<213>人工合成
<400>5
ttagagagcattctggtttaaaggttg27