專利名稱:一種基因結(jié)構(gòu)和功能研究相關(guān)的序列拆解技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供的,是一種通用的拆解目標(biāo)核酸序列的方法,具體地說,就是在目標(biāo)核酸序列中插入一段附加序列,該附加序列除含有必要的進(jìn)行基因工程意義上的操作所需要的結(jié)構(gòu)外,另外一個(gè)重要的特點(diǎn),就是它的存在,不干擾目標(biāo)核酸序列在轉(zhuǎn)錄或者轉(zhuǎn)譯水平上的功能,從而使得對(duì)目標(biāo)序列的遺傳工程上的操作變得更為靈活。該方法在后基因組時(shí)代,與基因結(jié)構(gòu)和功能相關(guān)的多種類型的遺傳載體的構(gòu)建方面,有極為重要的應(yīng)用。
增加基因的遺傳可操作性,一般包括以下幾個(gè)方面的意義一是增加特殊的酶作用位點(diǎn);二是增加特殊的功能區(qū);三是將相應(yīng)生物分子的編碼基因在功能及結(jié)構(gòu)的意義上拆解。
所以,當(dāng)待研究的目標(biāo)基因序列中,符合需要的位點(diǎn)不存在時(shí),就需要通過改變其序列的辦法來獲得,但一般情況下,大規(guī)模的改變基因的編碼序列,常常又要導(dǎo)致其功能的改變,例如,編碼蛋白的基因,當(dāng)以cDNA的形式出現(xiàn)時(shí),是一個(gè)連續(xù)的編碼氨基酸的開放閱讀框架,由于基因一級(jí)DNA序列對(duì)它所編碼的蛋白功能的決定性關(guān)系,因此,留給研究人員的、在遺傳工程的水平上修飾該基因但又保持其固有功能的空間非常有限;因此,為達(dá)到有關(guān)的實(shí)驗(yàn)?zāi)康?,研究人員通常采取以下兩個(gè)方面的手段一是利用氨基酸編碼序列的簡(jiǎn)并性,制造所需要的突變;二是在對(duì)相關(guān)基因的結(jié)構(gòu)和功能的詳細(xì)研究的基礎(chǔ)上,引入較大范圍的突變,但盡量把突變對(duì)功能的影響,控制在不干擾其實(shí)驗(yàn)?zāi)康牡某潭葍?nèi);雖然這兩種方法得到較廣的應(yīng)用,但其局限性是非常明顯的。
在人類基因組測(cè)序工作取得突破性進(jìn)展以后,對(duì)基因編碼產(chǎn)物功能的研究,成了生命科學(xué)家面臨的全新挑戰(zhàn)。在眾多與基因功能研究相關(guān)的技術(shù)手段中,其極為關(guān)鍵的一個(gè)步驟,就是需要將一個(gè)完整的生物分子的編碼基因,如編碼蛋白的cDNA,拆解成兩個(gè)部分,并分別置于不同的表達(dá)載體中,然后再通過它們?cè)趯?shí)驗(yàn)過程中的對(duì)接和重新表達(dá),為相關(guān)的實(shí)驗(yàn)提供觀測(cè)的窗口。目前所用的拆解基因編碼序列的辦法,一般都是根據(jù)不同的生物分子結(jié)構(gòu)和功能上特點(diǎn)設(shè)計(jì)的,費(fèi)時(shí)費(fèi)力,也不具有普遍性。
以生命的基因型和表型研究中極為重要的基因刪除實(shí)驗(yàn)為例?;騽h除實(shí)驗(yàn),常常需要將一個(gè)用于標(biāo)記作用的基因在結(jié)構(gòu)和功能的意義上被拆解成兩個(gè)部份,并克隆到不同的載體中去,以便在實(shí)驗(yàn)的后續(xù)階段,通過這兩個(gè)部份的編碼框架的重新對(duì)接以及原來的基因功能的恢復(fù),作為成功進(jìn)行刪除的指針;這里就提出一個(gè)如何對(duì)基因進(jìn)行拆解的問題要在結(jié)構(gòu)和功能的意義上拆解基因序列,同時(shí)又要保證被拆解的基因在重新對(duì)接后能在轉(zhuǎn)錄和轉(zhuǎn)譯產(chǎn)物的水平上恢復(fù)原有的功能,并不很容易做到,因?yàn)椴鸾膺^程中加入的外源序列,常常導(dǎo)致在原來的蛋白編碼框架內(nèi)部,增加額外的編碼氨基酸的序列,因而該基因所編碼的蛋白的功能,也常常受到破壞,為解決這一困擾,到目前為止,研究人員常常通過事先選擇合適的插入位點(diǎn)和插入序列、以使得外源的氨基酸不破壞整體蛋白的功能結(jié)構(gòu),但這個(gè)辦法,一來費(fèi)時(shí)費(fèi)力,二來不容易成功;另外一些研究者則通過將蛋白編碼基因序列的起始碼(一般情況下為ATG)和后續(xù)序列分開的辦法來解決這個(gè)問題,但這只能做到結(jié)構(gòu)上的分離,而無(wú)法做到功能上的分離,因?yàn)槿绱诵纬傻南掠涡蛄?,在和任何一個(gè)其它的表達(dá)框架融合之后,就可以重新獲得原有的功能,因?yàn)橐话闱闆r下,ATG編碼的met的丟失,并不影響蛋白的整體結(jié)構(gòu)和功能;以上兩個(gè)辦法,并不能真正做到同時(shí)在結(jié)構(gòu)和功能的意義上拆解基因框架。
隨著后基因組時(shí)代的到來,對(duì)基因功能和結(jié)構(gòu)的研究,越來越需要一個(gè)通用的方法,它的應(yīng)用,既能增加基因的遺傳可操作性,同時(shí)又不改變目標(biāo)基因本身的編碼功能。本發(fā)明提供的,就是滿足這一后基因組時(shí)代特殊要求的增加基因可操作性的方法。
發(fā)明詳述本發(fā)明提供的是一種在實(shí)驗(yàn)層次上更靈活地操作編碼蛋白或者其它生物分子的基因序列的方法,其基本設(shè)計(jì)原則是在目標(biāo)基因的序列中,通過實(shí)驗(yàn)手段,插入一段附加序列,其中含有用于對(duì)該基因進(jìn)行不同的操作目的的位點(diǎn)和次級(jí)序列等;由于該附加序列的插入,目標(biāo)基因被分成上游和下游兩個(gè)部份,但附加序列的插入,并不在轉(zhuǎn)錄和/或轉(zhuǎn)譯的水平上改變目標(biāo)基因的功能。
本發(fā)明提及的目標(biāo)基因,可以是任何形式的可被轉(zhuǎn)錄為RNA的基因序列,為描述方便,以目標(biāo)基因是對(duì)一種蛋白的編碼框架為例,對(duì)本發(fā)明作詳細(xì)說明,但本發(fā)明的應(yīng)用,并不受這一具體例子的限制。
本發(fā)明提供的方法,如前所言,是在目標(biāo)基因的編碼區(qū),插入一段附加序列,而附加序列的特點(diǎn)之一,就是不影響原來基因的轉(zhuǎn)錄和轉(zhuǎn)譯產(chǎn)品的功能,本發(fā)明實(shí)現(xiàn)這一目的的辦法,就是設(shè)法讓附加的序列在轉(zhuǎn)錄或者轉(zhuǎn)譯的過程中,在不影響插入位置外周序列的情況下,被完全刪除掉。
一般情況下,真核生物的由外顯子(exon)和內(nèi)含子(intron)組成的基因,其內(nèi)含子部分,在RNA的水平上就被刪除了,但決定這種刪除過程的序列信號(hào),同時(shí)被外顯子和內(nèi)含子序列共同決定。如圖一所示,一個(gè)內(nèi)含子(intron)的上游和下游的與鄰近外顯子(exon)的交界處,分別有一段被稱為SD(splicing donor)以及SA(splicing acceptor)的區(qū)域,在轉(zhuǎn)錄后形成的早期mRNA鏈上,與SA和SD對(duì)應(yīng)的序列,則包含了剪切的信號(hào)。以剪切的位點(diǎn)為界,這里將SD序列中,與決定上游剪切位點(diǎn)相關(guān)的部分,位于外顯子部分的,稱為A1,位于內(nèi)含子部分的,稱為B1;與之類似,這里將SA序列中,與決定下游剪切位點(diǎn)相關(guān)的部分,位于外顯子部分的,稱為A2,位于內(nèi)含子部分的,稱為B2;這樣,目標(biāo)基因轉(zhuǎn)錄后,最終形成的信號(hào)RNA,在剪切的交界處,就留下與A1A2相對(duì)應(yīng)的序列。
這種含有內(nèi)含子及其外圍部分外顯子序列的結(jié)構(gòu),常常被放進(jìn)一些分子生物學(xué)研究常用的載體中,但一般并不能被整合進(jìn)編碼序列中去,而是被置于某個(gè)激活子后面的可轉(zhuǎn)錄區(qū),以用來增加基因的表達(dá)效率;其中的原因很簡(jiǎn)單這樣的含有內(nèi)含子的結(jié)構(gòu),如果被置于表達(dá)框架之中,就無(wú)法在轉(zhuǎn)錄水平上被徹底刪除,因?yàn)橥庠床迦氲慕Y(jié)構(gòu),至少必須含有A1B1和A2B2兩個(gè)部分,才能為細(xì)胞內(nèi)的剪切機(jī)制識(shí)別,但由于精確的刪除位點(diǎn),并不在插入序列和目標(biāo)基因序列的接點(diǎn)上,而是在插入序列中間的位置上,決定這個(gè)刪除過程的兩側(cè)的部分附加序列A1和A2,將被繼續(xù)保留在目標(biāo)基因的序列中,因此,設(shè)計(jì)一種刪除位點(diǎn)和附加序列的插入位點(diǎn)精確重合的附加序列,是最理想的解決問題的辦法。
本發(fā)明提供的途經(jīng),是先制造一個(gè)被稱為刪除子(splicon)的序列。該刪除子序列的結(jié)構(gòu)特征是其上游和下游兩側(cè),分別含有B1和B2或者具有類似功能的序列,同時(shí)B1和B2之間,加入另一段可以幫助引導(dǎo)細(xì)胞剪切機(jī)制精確識(shí)別所設(shè)計(jì)的剪切位點(diǎn)的C序列,在這幾個(gè)基本的因素確定后,在刪除子的中間,就可以加上研究者希望引入的其它特定的序列,例如限制性內(nèi)切酶位點(diǎn)(RE),對(duì)轉(zhuǎn)錄過程起作用的序列(element),轉(zhuǎn)譯終止碼(SC),重組酶的識(shí)別位點(diǎn)(IS),某些特殊的遺傳序列的定點(diǎn)整合位點(diǎn),其它的兩端含有SA和SD的人工引入的外顯子序列(sa-exon-sd),以及其它的序列(other)。刪除子結(jié)構(gòu)可以提供定點(diǎn)突變插入或者其它的常規(guī)方法導(dǎo)入目標(biāo)基因。
本發(fā)明設(shè)計(jì)的刪除子,將圖一所示的SD及SA結(jié)構(gòu)中的B1和B2序列,分別置于刪除子的兩端,但由此帶來的另一個(gè)問題是由于丟失了A1和A2序列,B1和B2序列本身并不能被細(xì)胞的剪切機(jī)制識(shí)別,這個(gè)問題如何解決呢?在對(duì)真核細(xì)胞的RNA的剪切過程的詳細(xì)分析之后,就可以發(fā)現(xiàn),野生型的(wild type)SD和SA序列,通常具備一定的統(tǒng)計(jì)特征,對(duì)Genebank中收集的相關(guān)序列的分析,發(fā)現(xiàn)在許多基因的內(nèi)含子和外顯子的交接處的結(jié)構(gòu)一般都具有一定的保守性.
較為常見的SD序列,即5′剪切位點(diǎn)的統(tǒng)計(jì)特征是5′(A/C)AGGA(A/G)AGT 3′,此處的A1序列是5′(A/C)AG 3′,B1序列是5′GA(A/G)AGT 3′。
較為常見的SA序列,即3′剪切位點(diǎn)5′(T/C)(T/C)TT(T/C)(T/C)(T/C)(T/C)(T/C)(T/C)N CAGG 3′,這里的N代表該位置可以是A、G、C、T中的任何一個(gè)核苷酸。此處的B2序列是,5′(T/C)(T/C)TT(T/C)(T/C)(T/C)(T/C)(T/C)(T/C)N CAG3′;此處的A2序列是5′G 3′。
對(duì)應(yīng)于以上的SD和SA的保守序列,其相應(yīng)的A1A2的序列特征即是5′AAGG3′或者5′CAGG3′或者AGG。不過,值得強(qiáng)調(diào)的是一,以上的A1B1,A2B2僅是通過對(duì)大量的SD和SA序列的分析,得出的具有統(tǒng)計(jì)學(xué)意義的保守序列,雖然這樣的保守序列亦已經(jīng)被實(shí)驗(yàn)證明是有效的剪切位點(diǎn),但事實(shí)上野生型的SD和SA序列變化很大,其和上述統(tǒng)計(jì)意義上的保守序列之間,一般只具有一定程度的相似性;此外,野生型的SD和SA序列,也有一些是不屬于以上保守序列的范圍的;但這些變化顯然不構(gòu)成對(duì)本發(fā)明的限制,因?yàn)闊o(wú)論序列特征如何,只要在功能的意義上可以被細(xì)胞的RNA剪切機(jī)制識(shí)別,所有的SD和SA序列,都可以精確的剪切位點(diǎn)分界,被為A1B1和A2B2,因而其A1A2序列就可以被確定。
二,對(duì)細(xì)胞的RNA編輯機(jī)制而言,除了在SD和SA中精確的剪切位點(diǎn)兩側(cè)的序列外,其它的一些序列,有時(shí)也對(duì)剪切的效率等產(chǎn)生影響,其中比較重要的就是位于SA剪切位點(diǎn)上游的分枝序列(branch sitesequence),分枝序列通常也具有一定的保守性,例如,在酵母體系中的5′TACTAAC3′,或者哺乳體系中的5′Y N Y TRAY 3′。由于分枝序列位于SD剪切位點(diǎn)的下游和SA剪切位點(diǎn)的上游,因此,其可以被方便地設(shè)計(jì)到人工合成的刪除子序列中去,因而不會(huì)給本發(fā)明的應(yīng)用造成限制。由于分枝序列通常位于SA剪切位點(diǎn)上游非常接近的位置,所以,在本發(fā)明的具體描述中,就將分枝序列歸到B2序列中。
在本發(fā)明的描述中,雖然只要以保守型的A1,A2,B1,B2為例加以說明,但很顯然,這并不構(gòu)成對(duì)本發(fā)明的限制,事實(shí)上,對(duì)任何一種類型的SD和SA序列,就會(huì)有相應(yīng)的A1B1和A2B2序列,因此,也會(huì)有相應(yīng)的A1A2序列,以及和該A1A2序列相對(duì)應(yīng)的B1B2序列結(jié)構(gòu);其中,除A1A2序列需要目標(biāo)基因提供外,B1,B2序列則可以被設(shè)計(jì)到合成的刪除子序列中去。另一方面,也可以通過對(duì)目標(biāo)序列的修飾來人為制造所需要的內(nèi)源位點(diǎn),這樣的修飾可以利用遺傳編碼的簡(jiǎn)并性,甚至在目標(biāo)基因中制造突變,只要這種突變不對(duì)研究者的實(shí)驗(yàn)結(jié)果構(gòu)成影響.對(duì)細(xì)胞RNA編輯機(jī)制而言,一般情況下,以上描述的A1B1和A2B2序列已經(jīng)提供了足夠的識(shí)別和剪切信號(hào),但在有些情況下,其它的一些序列,也會(huì)對(duì)剪切效率等產(chǎn)生影響,因而也可以有選擇地被設(shè)計(jì)進(jìn)刪除子序列中去,在本發(fā)明的描述中,將這一類序列,統(tǒng)稱為C序列,但由于C序列通常不是必需序列,所以,為描述的簡(jiǎn)潔和方便,此處以及本發(fā)明的實(shí)施例中,仍然以對(duì)細(xì)胞的RNA編輯機(jī)制必需的A1B1和A2B2序列為主進(jìn)行描述,但這也不意味作對(duì)本發(fā)明的限制。
從以上的分析可以知道,在刪除后形成的對(duì)應(yīng)于A1A2序列的結(jié)構(gòu),一般情況下,都不復(fù)雜,研究表明,供體和受體序列中精確的剪切位點(diǎn)外圍的序列,具有一定的規(guī)律,比較常見的A1---A2序列的特征為AAG-----G和CAG-----G,就是說,在剪切后,形成的A1A2序列的結(jié)構(gòu)特征為AAGG或者CAGG,在某些野生型的A1A2序列中,甚至AGG前面的核甘酸對(duì)剪切識(shí)別所起的作用很小,因此,對(duì)任意一段DNA序列,隨機(jī)出現(xiàn)以上特征的A1A2序列的概率在1/256至1/64之間,也就是說,在每一段長(zhǎng)度在64bp至256bp的DNA片段中,就可以出現(xiàn)一個(gè)滿足要求的A1A2序列。如果考慮到真核細(xì)胞中,還存在其它類型的野生型的SD和SA序列及其相應(yīng)的A1A2序列,事實(shí)上,對(duì)任意一段DNA序列,找到合適的具備A1A2特征序列的概率,遠(yuǎn)大于1/64;必要的情況下,還可利用氨基酸編碼子的簡(jiǎn)并特點(diǎn),即某些氨基酸的編碼,存在多種選擇,因而是可變的,這為人工制造刪除子的特征結(jié)構(gòu)提供了條件;此外,在某些特殊的情況下,目標(biāo)基因內(nèi)部的某些序列,例如氨基酸編碼序列,其所編碼的氨基酸,在功能上是可以被置換或者刪除的;總之,無(wú)論是內(nèi)源固有的還是人工制造的,刪除后特征結(jié)構(gòu)是一旦被發(fā)現(xiàn)或者形成,就可以為刪除子提供極佳的插入位點(diǎn)。一般情況下,由于這些具備A1A2特征的序列,可以出現(xiàn)包括基因組序列的任何目標(biāo)基因序列中,它們的出現(xiàn),即使在目標(biāo)基因是cDNA情況下,多數(shù)也并非是剪切后遺留下來的,所以,為示區(qū)別,圖二將這樣的結(jié)構(gòu),標(biāo)為a1和a2,而a1和a2的分解,就是人工刪除子序列精確的插入位點(diǎn)。但這僅僅是為區(qū)別來源的不同,從序列特征上講,本發(fā)明的描述中,A1,A2,B1,B2和a1,a2,b1,b2可以互用,在意義上也可以互相取代。
其后的實(shí)驗(yàn)過程,以A1A2或者a1a2的序列特征是AAGG為例加以說明。首先在目標(biāo)基因的序列內(nèi),尋找內(nèi)源性的AAGG位點(diǎn),然后將含有滿足研究者特殊需要的序列結(jié)構(gòu)的刪除子,通過定點(diǎn)突變或者其它的方法,插入兩個(gè)G之間,形成AAG(splicon)G的結(jié)構(gòu),最終形成一個(gè)人工制造的可以被細(xì)胞的剪切機(jī)制刪除的仿真結(jié)構(gòu),其精確的刪除位點(diǎn),就是外源的刪除子的插入界面,即當(dāng)其轉(zhuǎn)錄產(chǎn)物被細(xì)胞的剪切機(jī)制識(shí)別并剪切后,和刪除子對(duì)應(yīng)的部分,將被完全刪除,當(dāng)然,當(dāng)研究者在刪除子中設(shè)計(jì)了合成的其它外顯子時(shí),就是另一回事情了。
這里需要指出的是,決定精確的刪除位點(diǎn)的,除了SD和SA以外,還有其它一些序列可以影響到刪除的效率,這里統(tǒng)稱為C序列,本這些相關(guān)的序列,都可以設(shè)計(jì)到刪除子序列中去。此外,除了特征性的A1A2序列外,刪除子插入位點(diǎn)周圍的其它序列,在某些情況下,也會(huì)對(duì)刪除實(shí)驗(yàn)構(gòu)成一點(diǎn)影響,但由于目標(biāo)基因中,可以選用的插入位點(diǎn)比較豐富,遇到此類特殊的情況,一般都選擇不同的位點(diǎn)的辦法加以規(guī)避。
總之,本發(fā)明提供的方法,在應(yīng)用上,并不依賴目標(biāo)基因的特殊性質(zhì),因而應(yīng)用范圍極廣,具體地講,至少包括以下幾個(gè)方面的一個(gè)或者多個(gè)一,在結(jié)構(gòu)和功能的雙重意義上,將編碼基因例如cDNA進(jìn)行分離;二,在目標(biāo)基因或者基因組中,引入新的供分子操作的位點(diǎn),例如限制性內(nèi)切酶位點(diǎn),特殊因子的識(shí)別位點(diǎn)等;三,利用刪除子序列,在目標(biāo)基因中引入一段外源的外顯子區(qū)等等;具體應(yīng)用的不同,也使得實(shí)驗(yàn)的對(duì)象目標(biāo)基因序列的來源有所不同,它們可以是一段cDNA,也可以是一段基因組序列,或者是一段人工合成的序列,在某些特殊的情況下,甚至是RNA序列等。但本發(fā)明提供的方法,既包含了所有的滿足要求的位點(diǎn)序列,即使對(duì)于那些cDNA中經(jīng)自然的剪切過程遺留的位點(diǎn),本發(fā)明也提供了全新的利用途經(jīng),即(1)不必要知道與該互補(bǔ)DNA相應(yīng)的基因組結(jié)構(gòu);(2)即使在相應(yīng)的基因組的結(jié)構(gòu)完全清楚的情況下,也不必要完全恢復(fù)所有的基因組序列;(3)其它用于不同研究目的的位點(diǎn)或者序列,可以方便地引入目標(biāo)基因而不會(huì)影響其原有的編碼功能。所以,本發(fā)明的涵蓋范圍,實(shí)際上也包括了對(duì)野生型內(nèi)含子中的一個(gè)或者幾個(gè)的部分恢復(fù),不論這種恢復(fù)是否同時(shí)也加進(jìn)了其它的序列結(jié)構(gòu)。
本發(fā)明提供的,是一種通用的在遺傳物質(zhì)例如DNA或者RNA中增添附加序列的方法,利用本發(fā)明的刪除子加入的序列,可以精確地按照研究人員的意愿,一,在轉(zhuǎn)錄的水平上,將外源序列完全剪除,以使原來的目標(biāo)基因的序列在轉(zhuǎn)錄和轉(zhuǎn)譯的意義上被恢復(fù);或者二,將另一個(gè)外顯子序列,在轉(zhuǎn)錄和轉(zhuǎn)譯的水平上,精確地整合進(jìn)原來的表達(dá)框架中。
當(dāng)然,本發(fā)明的應(yīng)用,還包括了對(duì)本發(fā)明進(jìn)行的一些常規(guī)分子生物學(xué)意義上的修飾所形成的方法,例如,可以將A1A2上的部分或者全部序列,設(shè)計(jì)到B1或者B2的兩端,或者相反,將B1B2上的部分或者全部序列,設(shè)計(jì)到A1或者A2的之間.例如,如果A1A2序列是AAGG,那么,可以將其中的兩個(gè)G分別置于B1和B2兩端,刪除子序列因而就成為G-B1----------B2-G,相應(yīng)的,只要在目標(biāo)序列中找到連續(xù)兩個(gè)A,就可以用作插入位點(diǎn)了。通過這樣的辦法,研究者可以在增強(qiáng)目標(biāo)基因的遺傳可操作性的同時(shí),在目標(biāo)序列中制造插入或者缺失突變。
原則上,本發(fā)明的目標(biāo)基因,可以是任何DNA序列或者可以轉(zhuǎn)化為DNA序列的其它生物分子;即使對(duì)野生型的基因組序列,也可以利用本發(fā)明提供的方法,則可在加入另外的結(jié)構(gòu)序列同時(shí)不影響該基因在轉(zhuǎn)錄和轉(zhuǎn)翻譯水平上的編碼功能,或者按人工設(shè)計(jì)的方法,精確地加入外源的外顯子。本發(fā)明也可以用于對(duì)一些編碼蛋白以外的其它生物分子的基因序列上,比如對(duì)一些具有RNA酶活性的基因等。利用本發(fā)明的方法所修飾的目標(biāo)序列,可以被放置進(jìn)任意的系統(tǒng)中去,如常規(guī)的分子生物學(xué)克隆載體和應(yīng)相的用于載體擴(kuò)增細(xì)菌,病毒體系,細(xì)胞體系甚至人工制備的體外實(shí)驗(yàn)體系等.本發(fā)明使研究人員獲得一種簡(jiǎn)便的在目標(biāo)基因中引入需要的各種位點(diǎn)或者序列,以方便地諸如拆解目標(biāo)基因或者其它遺傳工程意義上的操作。
以下實(shí)施例,是為了說明本發(fā)明,但不構(gòu)成對(duì)本發(fā)明的限制。
本應(yīng)用實(shí)例在實(shí)驗(yàn)方法上并不復(fù)雜,對(duì)其涉及的常規(guī)的實(shí)驗(yàn)技術(shù),如分子克隆,PCR反,細(xì)菌轉(zhuǎn)染,培養(yǎng)細(xì)胞基因轉(zhuǎn)染,DNA測(cè)序,熒光顯微鏡觀察等,均為非常成熟的細(xì)胞和分子生物學(xué)技術(shù),具體的反應(yīng)條件,可以通過對(duì)冷泉港實(shí)驗(yàn)室的分子生物手冊(cè)方便地查出,故不詳細(xì)描述。但對(duì)實(shí)驗(yàn)關(guān)鍵的部分,如引物的設(shè)計(jì),刪除子的結(jié)構(gòu)等,本應(yīng)用實(shí)例均將一一詳細(xì)加以說明。
選定EGFP的編碼基因作為目標(biāo)序列,是因?yàn)閷?duì)EGFP基因和蛋白序列的極小的改變,都將導(dǎo)致該蛋白空間結(jié)構(gòu)的變化,從而使得EGFP失去發(fā)散熒光的功能,這就給刪除子的插入對(duì)EGFP蛋白功能影響的研究,提供了一個(gè)非常方便的觀察指標(biāo)。
綠色熒光蛋白的基因序列,根據(jù)已發(fā)表的序列,通過DNA合成儀合成不同長(zhǎng)度的DNA雙鏈,然后拼接而成,部份序列則通過插入突變的方式加入。
完整的EGFP基因序列,被克隆進(jìn)被pCMV。pCMV是由pUC19改造而來,即在pUC19的多克隆位點(diǎn)區(qū)插入一個(gè)CMV激活子,再于CMV激活子下游加入一個(gè)來自SV40病毒的轉(zhuǎn)錄終止序列(transcriptiontermination signal or poly A signal),經(jīng)改造的pUC 19被稱為pCMV。
合成的EGFP基因序列被克隆進(jìn)CMV和polyA信號(hào)之間,含有EGFP基因的pCMV載體被稱為CMV-EGFP,后續(xù)splicon插入實(shí)驗(yàn),就以CMV-EGFP的基礎(chǔ)上進(jìn)行,EGFP的基因編碼序列,即是本例中的目標(biāo)基因序列,本實(shí)驗(yàn)的目的,就是要在目標(biāo)基因序列中插入一段splicon(即刪除序列)的同時(shí)又能保證EGFP基因表達(dá)產(chǎn)物的結(jié)構(gòu)和功能不受插入的splicon序列的影響。
如圖3a和3b所示,Splicon序列,被通過插入突變的方法,引入EGFP的編碼區(qū);其準(zhǔn)確的插入位點(diǎn),在EGFP第95和96位置的氨基酸的編碼序列對(duì)應(yīng)的caggag之間,此處的cagg序列,就是一個(gè)理想的A1A2或者a1a2序列,splicon序列被通過定點(diǎn)突變的方法插入caggag的兩個(gè)g之間,定點(diǎn)插入突變所用的引物序列如下Primer 1:5′-3′:ggata acttc gtata atgta tgcta tacga acggt actcg agtta gtcac ttacctggac gtagccttcg ggcat ggcgg acttg(SEQ ID NO.1)primer 2:5′-3′:ctgat atcct attgg tctta ctaac atcca ctttg ccttt ctctc cacag gagcgcacca ctttc ttcaaggacg acg(SEQ ID NO.2)定點(diǎn)插入突變是通過Taq polymerase和14輪鏈聚合反應(yīng)完成的,所得的反應(yīng)溶液,然后被轉(zhuǎn)入HB101受體態(tài)細(xì)菌,陽(yáng)性克隆首先被通過脢切進(jìn)行初步鑒定。這樣,在EGFP第95和96位置的氨基酸的編碼序列間,插入了一個(gè)外源的刪除子序列。最后在以上選定的位點(diǎn)插入的splicon的序列是5′-3′gtaag tgact aactc gagta ccgtt cgtat agcat acatt atacg aagtt atccc tgata tccta ttggtcttac taacatccac tttgc ctttc tctcc acag(SEQ ID NO.3)含有以上刪除子序列的EGFP基因的載體,被稱為pCMV-splicon,新插入的片段,通過序列測(cè)定,證明是正確的。
為證實(shí)splicon能否在轉(zhuǎn)錄的水平上被精確刪除,我們將pCMV-splicon經(jīng)瞬時(shí)轉(zhuǎn)染的辦法,導(dǎo)入Hela細(xì)胞,在CMV激活子控制下轉(zhuǎn)錄的EGFP編碼基因信息RNA,如果其中對(duì)應(yīng)于splicon的序列能被精確刪除,那么,細(xì)胞中就應(yīng)該表達(dá)綠色熒光,熒光顯微鏡下的觀察證實(shí)了這一結(jié)果。為進(jìn)一步證實(shí)刪除的精確性,轉(zhuǎn)染細(xì)胞的信息RNA被用反轉(zhuǎn)PCR的辦法擴(kuò)增,并對(duì)所得到的PCR產(chǎn)物進(jìn)行了序列分析,RT-PCR所用引物如下primer 3:5′-3′:acc ctc gtg acc acc ctg acc;(SEQ ID NO.4)promer 4:5’-3’:gtc gcc ctc gaa ctt cac ctc;(SEQ ID NO.5)對(duì)PCR產(chǎn)物的序列分析的結(jié)果,證明被整合進(jìn)EGFP基因的splicon序列,已經(jīng)按預(yù)期的位點(diǎn)被精確的刪除。由于在splicon中設(shè)計(jì)了許多新的位點(diǎn),如多克隆位點(diǎn),定點(diǎn)整合位點(diǎn)等,因此,在遺傳工程的水平上諸如酶切,外源序列的插入,基因編碼序列的拆解等操作,就有了更多的選擇,操作的靈活性被增加。
雖然以上通過具體的實(shí)施方案對(duì)本發(fā)明進(jìn)行了具體描述,但本領(lǐng)域技術(shù)人員可以理解,在不背離本發(fā)明的原則和精神的情況下可以對(duì)本發(fā)明作出各種改變和改進(jìn)。因此,所有這些改變和改進(jìn)都應(yīng)包括在本說明書和所附的權(quán)利要求書的范圍之內(nèi)。
權(quán)利要求
1.一種通用的增強(qiáng)目標(biāo)核酸分子遺傳可操作性的方法,該方法包括下列步驟A.首先在目標(biāo)序列中,尋找或者通過遺傳工程的辦法制造合適的內(nèi)源位點(diǎn);B.通過遺傳工程的方法,在(A)所說的內(nèi)源位點(diǎn)中插入外源的刪除子序列;C.根據(jù)需要對(duì)所獲得的整合有外源刪除子序列的目標(biāo)序列進(jìn)行各種遺傳操作;以上方法的特征是在外源的刪除子序列插入內(nèi)源位點(diǎn)之后,新形成的整合有外源刪除序列的目標(biāo)序列,在轉(zhuǎn)錄成RNA后,可以被真核細(xì)胞或者類似真核細(xì)胞的系統(tǒng)的RNA編輯機(jī)制識(shí)別和剪切,以上形成的RNA分子中與刪除子序列對(duì)應(yīng)的序列將被完全切除,原來的目標(biāo)序列在成熟mRNA的水平上,其結(jié)構(gòu)和功能不因目標(biāo)序列中刪除子的插入而改變。
2.根據(jù)權(quán)利要求1的方法,其中所說的目標(biāo)序列,是任意來源的核酸序列,包括a)基因組序列或者生物分子的基因序列;b)編碼蛋白或者其它生物活性分子的eDNA序列;c)對(duì)a)或者b)所說的目標(biāo)序列加以修飾形成的序列;d)其它的人工制備的核酸序列。
3.根據(jù)權(quán)利要求1所說的方法,該內(nèi)源位點(diǎn)具備A1A2或者a1a2的序列特征,刪除子序列的插入位置在A1和A2或者a1和a2之間。
4.根據(jù)權(quán)利要求3的方法,其中所說的內(nèi)源位點(diǎn)的A1序列是5′AAG3′或者5′CAG3′或者5′AG3′,而A2的序列是5′G3′。
5.根據(jù)權(quán)利要求1的方法,其中所說的刪除子序列的結(jié)構(gòu)特征是其上游和下游兩側(cè),分別含有B1和B2或者具有類似功能和特征的序列,同時(shí)B1和B2之間引入了用于不同遺傳操作目的的特定的序列。
6.根據(jù)權(quán)利要求5所說的方法,其中所說的B1或者b1的序列是5′GAAAGT3′或者5′GAGAGT3′;其中所說的B2或者b2的序列含有兩段特征序列,其中一段特征序列是位于B1或者b1的下游端即3′端,特征是5′(T/C)(T/C)TT(T/C)(T/C)(T/C)(T/C)(T/C)(T/C)NCAG 3′,另一段特征序列是分枝位點(diǎn)序列,特征是5′TACTAAC3′,或者5′YN Y TRAY 3′。
7.根據(jù)權(quán)利要求5所說的方法,其B2或者b2序列是5′tactaacatc cactt tgcct ttctc tccac ag 3′。
8.根據(jù)權(quán)利要求6的方法,其中所說的特定的序列包括限制性內(nèi)切酶位點(diǎn)(RE),對(duì)轉(zhuǎn)錄過程起作用的序列(element),轉(zhuǎn)譯終止碼(SC),重組酶的識(shí)別位點(diǎn)(RBE),不同的遺傳序列整合位點(diǎn)(IS),以及其它的序列(other)。
9.根據(jù)權(quán)利要求6的方法,其中所說的刪除子序列如下(5’-3’)gtaag tgact aactc gagta ccgtt cgtat agcat acatt atacg aagtt atccc tgatatccta ttggt cttac taaca tccac tttgc ctttc tctcc acag(SEQ ID NO3)。
10.根據(jù)權(quán)利要求1的方法,其中在同一目標(biāo)序列中,同時(shí)在一個(gè)以上的內(nèi)源位點(diǎn)插入刪除子序列。
11.根據(jù)權(quán)利要求1所說的方法,其目標(biāo)序列是某個(gè)基因的Cdna;內(nèi)源位點(diǎn)是對(duì)應(yīng)于該cDNA序列的基因組序列在轉(zhuǎn)錄成RNA后的剪切過程中因內(nèi)含子的刪除而留下來的A1A2結(jié)構(gòu);而刪除子則對(duì)應(yīng)于RNA編輯過程中被剪切的部分,或者對(duì)應(yīng)于RNA編輯過程中被剪切的部分加以修飾所形成的序列。
12.根據(jù)權(quán)利要求1到11的任一項(xiàng)方法,其特征是在刪除子序列兩端的B1和B2或者類似的結(jié)構(gòu)之間,引入一段上游和下游兩端分別由SA和SD組成的外顯子序列(sa-exon-sd)。
13.根據(jù)權(quán)利要求1到12的任一項(xiàng)方法,其特征是將A1或者A2上的部分或者全部序列,設(shè)計(jì)到B1或者B2的兩端,或者相反,將B1或者B2上的部分或者全部序列,設(shè)計(jì)到A1和A2之間;與此相應(yīng)的刪除子中的B1和/或B2序列,將比權(quán)利要求1到11的方法中的刪除子序列,核苷酸數(shù)目有所增加或者減少,相應(yīng)地,刪除子序列在目標(biāo)序列上合適的整合位點(diǎn)的序列,也在原來的A1A2的基礎(chǔ)上,有所減少或者增加。
14.利用權(quán)利要求1至13中任一項(xiàng)的方法將一段基因序列或者一個(gè)編碼蛋白或者其它生物分子的基因序列在結(jié)構(gòu)及功能上拆解成不同的部份,并被克隆到不同的載體中去。
15.利用權(quán)利要求1至13中任一項(xiàng)的方法將一段核酸序列分解成可用于不同的實(shí)驗(yàn)?zāi)康牡膸讉€(gè)部份。
16.含有權(quán)利要求1至13中任一項(xiàng)的方法中所說的全部或者部份刪除子序列的單鏈或雙鏈核酸序列。
17.含有權(quán)利要求1至13中任一項(xiàng)的方法中所說的全部或者部份刪除子序列的單鏈或雙鏈核酸序列的分子生物學(xué)載體,細(xì)菌細(xì)胞,病毒體系,細(xì)胞體系或者人工制備的體外實(shí)驗(yàn)體系。
全文摘要
本發(fā)明公開了一種通用的拆解目標(biāo)核酸序列的方法,即目標(biāo)核酸序列中插入一段附加序列,該附加序列除含有必要的進(jìn)行基因工程意義上的操作所需要的結(jié)構(gòu)外,另外一個(gè)重要的特點(diǎn),就是它的存在,不干擾目標(biāo)核酸序列在轉(zhuǎn)錄或者轉(zhuǎn)譯水平上的功能,從而使得對(duì)目標(biāo)序列的遺傳工程上的操作變得更為靈活。
文檔編號(hào)C12P19/00GK1414107SQ0113675
公開日2003年4月30日 申請(qǐng)日期2001年10月24日 優(yōu)先權(quán)日2001年10月24日
發(fā)明者萬(wàn)海粟 申請(qǐng)人:萬(wàn)海粟