專利名稱:基于鐵蛋白重鏈基因座的高表達(dá)基因座載體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分子生物學(xué)領(lǐng)域,具體涉及用于在經(jīng)轉(zhuǎn)化的細(xì)胞中表達(dá)異源基因序列的載體的開發(fā)及應(yīng)用。
相關(guān)技術(shù)常見的表達(dá)載體含有啟動子來驅(qū)動所需基因以及聚腺苷酸化信號來產(chǎn)生成熟的轉(zhuǎn)錄物。啟動子序列的長度傾向于僅有幾百個堿基對,并且含有大部分(如果不是全部的)調(diào)節(jié)區(qū)用于由瞬時轉(zhuǎn)染確定的最適表達(dá)。然而,盡管含有這些序列的表達(dá)構(gòu)建體在瞬時轉(zhuǎn)染中為高度功能性的,但是當(dāng)作為穩(wěn)定的轉(zhuǎn)染子被整合到染色體時,它們并不總是能夠產(chǎn)生相似的表達(dá)水平。這是由于位置依賴性表達(dá),一種整合位點對表達(dá)水平具有顯性且通常是陰性的效應(yīng)的現(xiàn)象(Wilson(1990),Ann.Rev.Cell Biol.6679-714)。位置依賴性表達(dá)的結(jié)果在轉(zhuǎn)染篩選的結(jié)果中是顯而易見的,這些細(xì)胞系中的大多數(shù)不產(chǎn)生或幾乎不產(chǎn)生產(chǎn)物。因此,為鑒定單個的高表達(dá)克隆,通常有必要篩選大量的轉(zhuǎn)染子。即使在廣泛的篩選后,用標(biāo)準(zhǔn)的表達(dá)載體獲得的轉(zhuǎn)染子一般具有的表達(dá)水平也不足以達(dá)到商品化滴度目標(biāo)。
常用費時費力的DHFR擴(kuò)增方法來提高穩(wěn)定轉(zhuǎn)染子的表達(dá)水平。例如,標(biāo)準(zhǔn)表達(dá)構(gòu)建體的完整拷貝一般需要擴(kuò)增到100個拷貝以上才能接近具有類似強(qiáng)度的啟動子(僅來自兩個等位基因)的內(nèi)源基因表達(dá)水平。標(biāo)準(zhǔn)表達(dá)載體與內(nèi)源基因的不同最有可能是因為在內(nèi)源基因啟動子的5’和/或聚腺苷酸化信號的3’存在序列,這些序列能產(chǎn)生更有利于表達(dá)的染色質(zhì)構(gòu)型。含有能產(chǎn)生有利的非位置依賴性(position-independent)染色質(zhì)構(gòu)型的序列的表達(dá)構(gòu)建體(不管整合位點如何),有利于產(chǎn)生高表達(dá)異源基因的細(xì)胞系。
發(fā)明概述本發(fā)明部分依賴于來自鐵蛋白重鏈基因(ferritin heavy chaingene)的高表達(dá)“基因座載體”的開發(fā)。“基因座載體”的概念基于以下觀察在高表達(dá)基因的天然染色質(zhì)范圍(context)中發(fā)現(xiàn)的位于高表達(dá)基因的5’和3’的區(qū)域能使得異源基因具有高表達(dá)水平。所以,本發(fā)明提供了鐵蛋白重鏈基因座載體,其包含能使異源基因在穩(wěn)定轉(zhuǎn)染子中高表達(dá)的5’和3’序列。因此本發(fā)明提供了穩(wěn)定轉(zhuǎn)染并在真核細(xì)胞中高水平表達(dá)所需蛋白的基因載體。
在一個方面中,本發(fā)明提供了穩(wěn)定轉(zhuǎn)染以及在真核細(xì)胞中表達(dá)所需蛋白的基因載體,該基因載體包括(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)至少一個異源序列的第一插入位點;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中這些序列以5’到3’方向按(a)-(d)的順序可操作地連接,相鄰序列間有可選的接頭序列;以及其中(1)該遠(yuǎn)端5’側(cè)翼序列包含至少100個堿基的序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;和/或(2)該近端5’調(diào)節(jié)序列包含至少20個堿基的序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
另一個方面,該載體包括至少一種編碼所需蛋白的第一異源編碼序列。因此,本發(fā)明提供了穩(wěn)定轉(zhuǎn)染以及在真核細(xì)胞中表達(dá)所需蛋白的基因載體,其包括(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)至少一種編碼該所需蛋白的第一異源編碼序列;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中這些序列以5’到3’方向按(a)-(d)的順序可操作地連接,相鄰序列間有任選的接頭序列;以及其中(1)該遠(yuǎn)端5’側(cè)翼序列包含至少100個堿基的序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;和/或(2)該近端5’調(diào)節(jié)序列包含至少20個堿基的序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
在一些實施方案中,該遠(yuǎn)端5’側(cè)翼序列來自鐵蛋白重鏈基因座。在其它的實施方案中,該近端5’調(diào)節(jié)序列來自鐵蛋白重鏈基因座。在另外一些實施方案中,該近端5’調(diào)節(jié)序列及遠(yuǎn)端5’側(cè)翼序列均來自鐵蛋白重鏈基因座。
在一些實施方案中,該近端3’調(diào)節(jié)序列來自鐵蛋白重鏈基因座。在一些實施方案中,該載體進(jìn)一步包含鐵蛋白重鏈基因座的遠(yuǎn)端3’側(cè)翼序列。
在本發(fā)明的一些實施方案中,異源序列的插入位點包含至少一個限制性內(nèi)切核酸酶位點,在其它的一些實施方案中,異源序列的插入位點是包含至少兩個限制性內(nèi)切核酸酶位點的多接頭位點。
在本發(fā)明的一些實施方案中,該近端5’調(diào)節(jié)序列包括真核內(nèi)含子序列。在一些上述實施方案中,該真核內(nèi)含子序列來自鐵蛋白重鏈基因的內(nèi)含子1。在一些實施方案中,近端5’調(diào)節(jié)序列包含未翻譯的外顯子序列。
在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列和近端5’調(diào)節(jié)序列總長在1,000到10,000個堿基之間。類似地,在一些實施方案中,近端3’調(diào)節(jié)序列及任意遠(yuǎn)端3’側(cè)翼序列總長在1,000到10,000個堿基之間。
另一方面,本發(fā)明提供了用本發(fā)明任意載體轉(zhuǎn)染的真核細(xì)胞。在一些實施方案中,載體已經(jīng)穩(wěn)定整合到該細(xì)胞的染色體中,在一些實施方案中,第一異源編碼序列在該細(xì)胞中表達(dá)。
在一些實施方案中,本發(fā)明提供了真核細(xì)胞,其包括(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)至少一種第一編碼序列;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中這些序列以5’到3’方向按(a)-(d)的順序可操作地連接,相鄰序列間有任選的接頭序列;以及其中(1)該遠(yuǎn)端5’側(cè)翼序列包含一種至少100個堿基的外源序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;和/或(2)該近端5’調(diào)節(jié)序列包含一種至少20個堿基的外源序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
另一個方面,本發(fā)明提供了一種真核細(xì)胞,其包括一種來自鐵蛋白重鏈基因座可操作地連接到編碼序列的外源5’遠(yuǎn)端側(cè)翼序列。
另一個方面,本發(fā)明提供了一種在真核細(xì)胞中產(chǎn)生所需蛋白的方法,其包括以下步驟(a)提供至少一種本發(fā)明的細(xì)胞或其后代;(b)在允許高表達(dá)所需蛋白的條件下將該細(xì)胞維持在培養(yǎng)基中;以及(c)從所述培養(yǎng)基分離所需蛋白。
本領(lǐng)域的技術(shù)人員將從以下的詳細(xì)說明和實施例中清楚地了解到本發(fā)明的這些和其它方面以及本發(fā)明的優(yōu)點。
附圖簡述以下附圖是對本發(fā)明實施方案的例示,并非意味著限制如權(quán)利要求中所涵蓋的本發(fā)明的范圍。
圖1顯示了大鼠鐵蛋白重鏈外顯子序列。
圖2說明了將含有鐵蛋白重鏈外顯子的區(qū)域亞克隆到Litmus 38質(zhì)粒中的一個實施例。
圖3說明了從pFerX1缺失外顯子2,3和4,以及插入多接頭以產(chǎn)生質(zhì)粒pFerX2。
圖4說明了從pFerX2缺失外顯子1編碼區(qū)來產(chǎn)生質(zhì)粒pFerX3,以及缺失IRE來產(chǎn)生質(zhì)粒pFerX4。
圖5A-B說明了從粘粒15A中去除鐵蛋白重鏈基因外顯子2到4的PCR融合物。
圖6說明了將圖5的PCR融合產(chǎn)物插入pFerX4的HpaI及AatII位點,產(chǎn)生質(zhì)粒pFerX5。
圖7說明了從pFerX5去除SwaI位點,產(chǎn)生質(zhì)粒pFerX5.1。
圖8說明了將遠(yuǎn)端3’側(cè)翼序列加入pFerX6,產(chǎn)生質(zhì)粒pFerX7。
圖9說明了將鐵蛋白重鏈基因的遠(yuǎn)端5’側(cè)翼序列加入pFerX7,產(chǎn)生質(zhì)粒pFerX8。
圖10說明了質(zhì)粒pFerX8的基因圖譜,其包括序列的來源。
圖11說明了質(zhì)粒pFerX9的基因圖譜,其包括序列的來源。
圖12說明了質(zhì)粒pFerX8和質(zhì)粒pFerX9的經(jīng)轉(zhuǎn)錄的區(qū)的序列。
圖13說明了DHFR表達(dá)質(zhì)粒pSIDHFR.2的基因圖譜。
圖14顯示了測定轉(zhuǎn)染子集合體(pool)中的報告基因表達(dá)的試驗的結(jié)果。以及圖15顯示了在經(jīng)轉(zhuǎn)染的分離體(isolate)中測定報告基因表達(dá)的試驗的結(jié)果。
發(fā)明詳述在此所指的專利,科學(xué),醫(yī)學(xué)出版物確立了完成本發(fā)明時可為本領(lǐng)域技術(shù)人員所利用的知識。已授權(quán)美國專利,已公布的及待審的專利申請以及其它引用的參考文獻(xiàn)的全部公開內(nèi)容茲在此引入作為參考。
定義在此所用的所有技術(shù)術(shù)語和科學(xué)術(shù)語,除非在下面另行定義,均旨在與本領(lǐng)域技術(shù)人員通常所理解的含義相同;在此所應(yīng)用的技術(shù)的引用旨在指本領(lǐng)域通常所理解的技術(shù),包括那些為本領(lǐng)域技術(shù)人員所顯而易見的技術(shù)上的改變或等同技術(shù)的替代。為了更加清晰仔細(xì)地描述本發(fā)明主題,提供了以下的定義來解釋用在說明書和所附權(quán)利要求中的一些術(shù)語。
真核基因座(Eukaryotic locus)。在此用到的術(shù)語“真核基因座”是指真核細(xì)胞的任一染色體基因座,其編碼能在合適的條件下在細(xì)胞中表達(dá)的多肽或RNA產(chǎn)物。線粒體基因座明顯地被排除在此用到的術(shù)語“真核基因座”的范圍之外。
遠(yuǎn)端(distal)5’側(cè)翼序列。在此用到的術(shù)語“遠(yuǎn)端5’側(cè)翼序列”是指側(cè)翼區(qū)核苷酸序列,其位于基因的近端5’調(diào)節(jié)序列的5’。因此,盡管這些序列因作用于染色質(zhì)構(gòu)型而影響轉(zhuǎn)錄速度,但是這些序列通常位于基本(basic)調(diào)節(jié)序列(如,操縱基因,啟動子,核糖體結(jié)合位點)的5’而且進(jìn)一步從轉(zhuǎn)錄起始位點被去除,而不是近端5’調(diào)節(jié)序列。遠(yuǎn)端5’側(cè)翼序列的大小范圍在100到100,000個堿基之間。在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列將包含500-50,000個堿基、750-25,000個堿基或1,000-10,000個堿基。遠(yuǎn)端5’側(cè)翼序列能在近端5’調(diào)節(jié)序列5’側(cè)的任一位置開始,一般在轉(zhuǎn)錄起始位點5’的20個堿基、50個堿基、75個堿基、100個堿基、500個堿基、1,000個堿基、5,000個堿基或10,000個堿基處開始。遠(yuǎn)端5’側(cè)翼序列可為從基因的啟動子和轉(zhuǎn)錄起始序列的5’延伸相當(dāng)長的(substantial)距離,一般在轉(zhuǎn)錄起始位點5’的100,000個堿基、50,000個堿基、25,000個堿基或10,000個堿基處結(jié)束。
近端(proximal)5’調(diào)節(jié)序列。在此用到的術(shù)語“近端5’調(diào)節(jié)序列”是指位于基因5’末端附近的核苷酸序列,其包括轉(zhuǎn)錄和翻譯必需的基本調(diào)節(jié)元件(即,啟動子以及如果存在的話,還包括操縱基因和核糖體結(jié)合序列)。近端5’調(diào)節(jié)序列的大小范圍在20到10,000堿基之間。在一些實施方案中,近端5’調(diào)節(jié)序列將包含50-5,000個堿基,75-1,000個堿基或100-500個堿基。在一些實施方案中,近端5’調(diào)節(jié)序列的3’末端可被定義為緊鄰編碼(immediate)區(qū)的翻譯起始點或起始密碼子的5’?;蛘撸谝恍嵤┓桨钢?,近端5’調(diào)節(jié)序列可包括包含內(nèi)含子的基因的內(nèi)部序列,因此,近端5’調(diào)節(jié)序列的3’末端可延伸到內(nèi)含子序列。此外,在一些實施方案中,近端5’調(diào)節(jié)序列可包括一些5’編碼序列(如,起始密碼子和/或短的N末端序列)。近端5’調(diào)節(jié)序列延伸到轉(zhuǎn)錄起始位點的5’而且可在轉(zhuǎn)錄起始位點5’的10,000個堿基、5,000個堿基、1,000個堿基、500個堿基、100個堿基、75個堿基、50個堿基或20個堿基處結(jié)束。
近端3’調(diào)節(jié)序列。在此用到的術(shù)語“近端3’調(diào)節(jié)序列”是指位于基因3’末端附近的核苷酸序列,其包括適當(dāng)?shù)膍RNA加工和翻譯終止所必需的基本調(diào)節(jié)元件(即,翻譯終止密碼子,聚腺苷酸化信號以及轉(zhuǎn)錄終止子)。近端3’調(diào)節(jié)序列的大小范圍在10-2,000個堿基之間。在一些實施方案中,近端3’調(diào)節(jié)序列將包含25-1,000個堿基,50-750個堿基或75-500個堿基。近端3’調(diào)節(jié)序列的5’末端可用翻譯終止或“停止”密碼子(即TAG,TTA或TGA)限定。近端3’調(diào)節(jié)序列延伸到翻譯終止密碼子的3’,而且可在翻譯終止密碼子的3’端的2,000個堿基、1,000個堿基、750個堿基或500個堿基處結(jié)束。
遠(yuǎn)端3’側(cè)翼序列。在此用到的術(shù)語“遠(yuǎn)端3’側(cè)翼序列”是指基因近端3’調(diào)節(jié)序列的3’的側(cè)翼區(qū)核苷酸序列。因此,這些序列是適當(dāng)?shù)膍RNA加工和翻譯終止所必需的基本調(diào)節(jié)序列(即終止密碼子及聚腺苷酸化信號)的3’,并進(jìn)一步從轉(zhuǎn)錄終止位點去除近端3’調(diào)節(jié)序列。而不是遠(yuǎn)端3’側(cè)翼序列的大小范圍在100到100,000個堿基之間。在一些實施方案中,遠(yuǎn)端3’側(cè)翼序列將包含500-50,000個堿基、750-25,000個堿基或1,000-10,000個堿基。遠(yuǎn)端3’側(cè)翼序列能在近端3’調(diào)節(jié)序列的3’的任一位置開始,一般在翻譯終止密碼子3’的500個堿基、750堿基、1,000個堿基或2,000個堿基處開始。遠(yuǎn)端3’側(cè)翼序列可在一個基因的轉(zhuǎn)錄終止密碼子及聚腺苷酸化序列的3’延伸相當(dāng)長的距離,而且一般在轉(zhuǎn)錄終止密碼子的3’的100,000個堿基、50,000個堿基、25,000個堿基或10,000個堿基處結(jié)束。
載體。在此用到的術(shù)語“載體”意味著任一能在細(xì)胞間轉(zhuǎn)移核酸的基因結(jié)構(gòu),如質(zhì)粒、噬菌體、轉(zhuǎn)座子、粘粒、染色體、病毒、病毒體等。載體可以具有復(fù)制、表達(dá)、重組、插入或整合中的一種或多種的能力,但沒有必要具備每一種能力。因此,這個術(shù)語包括克隆型(cloning)及表達(dá)載體。
轉(zhuǎn)染。在此用到的術(shù)語“轉(zhuǎn)染”意味著在細(xì)胞或生物體中引入一種載體,其可在該細(xì)胞或生物體中復(fù)制或在該細(xì)胞或生物體中表達(dá)一種多肽序列且其可以整合到或不整合到該細(xì)胞或生物體的基因組中。術(shù)語“轉(zhuǎn)染”通常囊括所有引入這種載體的各種方法,包括但不限于本領(lǐng)域涉及的方法如轉(zhuǎn)染、轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或基因轉(zhuǎn)移,以及包括諸如顯微注射、DEAE-葡聚糖介導(dǎo)的胞吞、磷酸鈣共沉淀、電穿孔、脂質(zhì)體介導(dǎo)的轉(zhuǎn)染、彈道注射、病毒介導(dǎo)的轉(zhuǎn)染以及相似的技術(shù)。經(jīng)過轉(zhuǎn)染的細(xì)胞或生物體在此被稱為“轉(zhuǎn)染子”。
穩(wěn)定轉(zhuǎn)染。在此用到的術(shù)語“穩(wěn)定轉(zhuǎn)染”意味著上面定義的轉(zhuǎn)染,其可導(dǎo)致載體的全部或部分整合到被轉(zhuǎn)染的細(xì)胞或生物體的基因組中。經(jīng)過穩(wěn)定轉(zhuǎn)染的細(xì)胞或生物體在此被稱為“穩(wěn)定轉(zhuǎn)染子”。
可操作地連接(operaby joined)。在此用到的術(shù)語“可操作地連接”是指基因調(diào)節(jié)元件和基因編碼區(qū)的一種功能性的共價鍵,此鍵可通過RNA聚合酶使編碼區(qū)轉(zhuǎn)錄成mRNA,該RNA聚合酶能結(jié)合一種或多種調(diào)節(jié)元件。因此,當(dāng)RNA聚合酶在容許性條件下有能力與調(diào)節(jié)區(qū)內(nèi)的啟動子結(jié)合并使編碼區(qū)轉(zhuǎn)錄成mRNA時,調(diào)節(jié)區(qū)包括調(diào)節(jié)元件,與編碼區(qū)可操作連接。就此而論,許可條件可包括組成型啟動子的標(biāo)準(zhǔn)的細(xì)胞內(nèi)條件,標(biāo)準(zhǔn)條件及缺無阻遏物或存在可抑制性啟動子/可誘導(dǎo)性啟動子的誘導(dǎo)物的條件,以及本領(lǐng)域所知的用于體外轉(zhuǎn)錄系統(tǒng)的合適的體外條件。
異源的。在此用到的術(shù)語“異源的”意味著對于兩個或多個基因序列,這些序列不是天然可操作地連接起來也不是天然在同一個基因組中天然出現(xiàn)。例如,如果一種載體包括一種被可操作連接到一個或多個調(diào)節(jié)元件的編碼區(qū),而這些序列不是天然可操作地連接起來也不是天然在同一個基因組中發(fā)現(xiàn)的,那么這些序列被認(rèn)為彼此是異源的。
核苷酸位置。在此用到的所有的核苷酸位置相對于DNA鏈命名,該DNA鏈包括“有義”取向的鐵蛋白重鏈基因區(qū)元件。從上下文中即可顯見,用數(shù)字表示的核苷酸位置命名或者相對于鐵蛋白重鏈基因起始密碼子的位置,或者相對于序列列表中包括的一種序列內(nèi)的位置。在前一種情況,起始密碼子(ATG)的腺苷或“A”命名為位置1,在這之前的位置編號為負(fù)。在后一種情況,相應(yīng)的SEQ ID NO總是被具體說明。相對的核苷酸位置可參照有義鏈傳統(tǒng)的5’和3’方向描述。
核苷酸序列同一性百分比。在此用到的兩個核苷酸序列間序列同一性百分比是基于兩個被比對的序列間相同的殘基數(shù)目除以存在于其中較短的那個序列的核苷酸數(shù)目來計算的。在計算同一性百分比之前,這些序列用具有缺省值的ClustalW程序運算算法(或一種等價算法)來比對,ClustalW程序可通過歐洲分子生物學(xué)實驗室(European Molecular Biology Laboratory)(EMBL)(http//www.ebi.ac.uk/clustalw)的歐洲生物信息學(xué)院(EuropeanBioinformatics Institute)查到,而且在Higgins等(1994)中描述“CLUSTAL WImproving the sensitivity of progressive multiple sequence alignment throughsequence weighting,position-specific gap penalties and weight matrix choice,”Nucleic Acids Res.224673-4680。
來自(derived from)。在此用到的術(shù)語“來自”的使用與核苷酸序列起源有關(guān)時,意味著該序列可通過在參照序列中進(jìn)行限定數(shù)目的插入,缺失或替代作用而已經(jīng)或能夠直接或間接獲得或產(chǎn)生。因此,例如,是參照序列子集的序列可來自缺失側(cè)翼序列的參照序列。同樣,序列可通過參照序列中插入,缺失和/或替代一個或多個核苷酸的組合而來源于該參照序列。插入,缺失和替代序列的數(shù)目可由參照序列和衍生序列間所需的百分比同一性所限定。
數(shù)值范圍。在此用到的變量數(shù)值范圍的講述旨在表明本發(fā)明可由等于那個范圍內(nèi)的任何值的變量來實施。因此,對一個固有離散變量來說,該變量等于數(shù)值范圍的每個整數(shù)值,包括該范圍的端點值。同樣,對一個固有連續(xù)變量來說,該變量等于數(shù)值范圍的每個實數(shù)值,包括該范圍的端點值。例如,一個描述為值在0到2之間的變量,若其為固有離散變量則為0、1、2,若其為固有連續(xù)變量則為0.0、0.1、0.001或其它任何≤2的實數(shù)值。
或。除非另外特別指出,在此用到的連接詞“或”用于“和/或”的“包含的”意義而不是“不是/就是”的“僅有的”意義。
發(fā)明內(nèi)容
本發(fā)明部分依賴于來自鐵蛋白重鏈基因的高表達(dá)“基因座載體”的開發(fā)。在高表達(dá)基因的天然染色質(zhì)鄰近序列中發(fā)現(xiàn)的在高表達(dá)基因5’和3’的區(qū)域能賦予異源基因高表達(dá)水平,“基因座載體”的概念是以這種觀察為基礎(chǔ)的。所以,本發(fā)明提供了鐵蛋白重鏈基因座載體,其包含能使異源基因在穩(wěn)定轉(zhuǎn)染子高表達(dá)的5’和3’序列。因此本發(fā)明提供了穩(wěn)定轉(zhuǎn)染并在真核細(xì)胞中高水平表達(dá)所需蛋白的基因載體。
鐵蛋白重鏈基因。
大鼠和人的基因組含有多重加工(multiple processed)的鐵蛋白重鏈假基因(Hentze等(1986),Proc.Natl.Acad.Sci.USA 837226-72307)。大鼠的鐵蛋白基因由被3個內(nèi)含子(即,內(nèi)含子1到3)分開的4個外顯子(即,外顯子1到4)組成。GenBank登錄號(Accession No)M18051,M18052和M18053公開了3個基因片段如圖1A,B,C部分所示。這三個節(jié)段合起來覆蓋了大鼠鐵蛋白重鏈基因組序列的4個外顯子。圖1(A)顯示了5’未翻譯序列的168bp,包括-168位置的轉(zhuǎn)錄起始位點,隨后為外顯子1及內(nèi)含子1的5’末端的前104bp。外顯子1包含起始密碼子并編碼38個氨基酸。圖1(B)顯示了內(nèi)含子1的3’末端最后的50bp,隨后為外顯子2及內(nèi)含子2的5’末端的前35bp。圖1(C)顯示了內(nèi)含子2的3’末端的最后33bp,隨后為外顯子3,內(nèi)含子3,外顯子4以及3’未翻譯序列,包括終止密碼子及終止密碼子后聚腺苷酸信號132bp。
由于粘粒文庫的插入片段的大小范圍相當(dāng)大,可從它們中挑選獲得足夠多的5’和3’側(cè)翼序列。更具體的說,選擇大鼠粘粒文庫目錄#RL1032m(BD Biosciences/Clontech,Palo Alto,CA)。但是,也可以用其它基因文庫,或者可合成制備序列。
在篩選粘粒文庫時為了避免對加工過的假基因的克隆,內(nèi)含子序列被選作探針模板。由大鼠基因組DNA(Catalog#6750-1,Clontech,Palo Alto,CA)作為模板以GenBank中的相關(guān)cDNA及基因組序列為引物通過PCR克隆得到這些內(nèi)含子。生物素化的探針可用內(nèi)含子作為模板而制備,并且粘粒文庫用所述探針來篩選。一種鐵蛋白重鏈基因粘粒(15A)可用限制性內(nèi)切核酸酶分離和繪制出來。GenBank中大鼠基因組序列的三個片段指導(dǎo)定位編碼區(qū)并計劃產(chǎn)生高表達(dá)基因座載體。
鐵蛋白重鏈基因高表達(dá)基因座載體的產(chǎn)生。
本發(fā)明的高表達(dá)基因座載體可通過許多方式產(chǎn)生。例如,形成載體的序列可從單克隆或多克隆得到。該序列可完全基于大鼠鐵蛋白重鏈基因,完全基于另一種哺乳動物的鐵蛋白重鏈,或基于多重的哺乳動物鐵蛋白重鏈基因。該序列可基于所有天然衍生的序列或天然衍生序列與合成序列的混合物。此外,基因座載體的產(chǎn)生方法,包括先獲得包含全部或部分的鐵蛋白重鏈基因區(qū)的一個或多個大基因組片段,然后缺失非目的序列或使非目的序列失活同時插入目的序列,或者僅僅克隆或亞克隆鐵蛋白重鏈基因區(qū)的目的片段,然后將這些片段與其它目的序列結(jié)合。同樣,這些方法的混合,應(yīng)用克隆、亞克隆、缺失、失活及插入的方法可用于獲得所需構(gòu)建體。方法的采取以及各步驟的順序與本發(fā)明無關(guān),可由本領(lǐng)域技術(shù)人員自行決定。
本發(fā)明的高表達(dá)基因座載體以5’到3’的順序依次包括(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)異源序列的至少一個第一插入位點;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效。連接序列可在片段(a)-(d)兩兩之間任選地存在。此外,遠(yuǎn)端5’側(cè)翼序列和近端5’調(diào)節(jié)序列中至少一種與鐵蛋白重鏈基因的相應(yīng)序列具有基本的同一性。在一些實施方案中,遠(yuǎn)端3’側(cè)翼序列也包括在該載體中。
本發(fā)明高表達(dá)基因座載體的一個實施方案,以下描述的pFerX8載體,已在GenBank登錄號AY147930中公開。
A.遠(yuǎn)端5’側(cè)翼序列及近端5’調(diào)節(jié)序列。
在一些實施方案中,基因座載體的遠(yuǎn)端5’側(cè)翼序列將包括一種100-100,000個核苷酸的序列,后與鐵蛋白重鏈基因座遠(yuǎn)端5’側(cè)翼序列內(nèi)發(fā)現(xiàn)的核苷酸序列至少具有70%-100%的同一性。因此,在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列可包括至少100、500、750、1,000、10,000、25,000、50,000或100,000個核苷酸,其與鐵蛋白重鏈基因座遠(yuǎn)端5’側(cè)翼序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。如下面的實施例所示,遠(yuǎn)端5’序列可包含1,000-10,000bp、2,000-9,000bp、3,000-8,000bp或4,000-7,000bp的側(cè)翼序列。
在其它的實施方案中,基因座載體的遠(yuǎn)端5’側(cè)翼序列將與相應(yīng)的鐵蛋白重鏈基因序列具有更低百分比的同一性,而且,在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列將與任何相應(yīng)的鐵蛋白重鏈基因序列無關(guān)。
本發(fā)明的高表達(dá)基因座載體包含在遠(yuǎn)端5’側(cè)翼序列下游的近端5’調(diào)節(jié)序列。在一些實施方案中,基因座載體的近端5’調(diào)節(jié)序列將包括一種至少20-10,000個核苷酸的序列,后者與鐵蛋白重鏈基因座近端5’調(diào)節(jié)序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%-100%的同一性。因此,在一些實施方案中,近端5’調(diào)節(jié)序列可包含至少20、50、75、100、500、1,000、5,000或10,000個核苷酸,其與鐵蛋白重鏈基因座近端5’調(diào)節(jié)序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。
在其它實施方案中,基因座載體的近端5’調(diào)節(jié)序列將與相應(yīng)的鐵蛋白重鏈基因序列具有更低百分比的同一性,而且,在一些實施方案中,近端5’調(diào)節(jié)序列將與任何相應(yīng)的鐵蛋白重鏈基因序列無關(guān)。
在所有的實施方案中,近端5’調(diào)節(jié)序列必須對插入載體的異源編碼區(qū)的起始轉(zhuǎn)錄有效。因此,在那些近端5’調(diào)節(jié)序列基于相應(yīng)的鐵蛋白重鏈基因序列的實施方案中,它們不應(yīng)發(fā)生很大程度的變化以至于該序列對起始或啟動轉(zhuǎn)錄無效。因此,諸如“TATA框”或核糖體結(jié)合位點的特征的保守性,或這些特征用相當(dāng)?shù)男蛄刑娲?,對保持表達(dá)載體的功能性是必需的。另一方面,用其它基因的功能等效物(包括任何許多已知的其它基因來源的近端5’調(diào)節(jié)區(qū))來完全替代這些序列也是可以容許的。同樣,用基于兩個或更多個基因的近端5’調(diào)節(jié)序列的嵌合序列來替代這些序列是可以容許的。
在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列及近端5’調(diào)節(jié)序列包括一種至少100-1000個核苷酸的序列,后者分別與鐵蛋白重鏈基因座遠(yuǎn)端5’側(cè)翼序列及近端5’調(diào)節(jié)序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%-100%的同一性。在一些實施方案中,遠(yuǎn)端5’側(cè)翼序列及近端5’調(diào)節(jié)序列與鐵蛋白重鏈基因座內(nèi)鄰接序列具有70%-100%的同一性。
由于鐵蛋白重鏈基因的內(nèi)含子1能包含正性(positive)調(diào)節(jié)元件,而且能協(xié)助RNA加工及轉(zhuǎn)運,其能有利于創(chuàng)建一種基因座載體,該載體包括保留全部或部分的內(nèi)含子1作為近端5’調(diào)節(jié)序列的一部分。這個過程可通過在內(nèi)含子1序列的起始位置的5’保留ATG密碼子以及任選地保留附加密碼子來實現(xiàn)。如果保留的是除ATG外其它的密碼子,它們可來自鐵蛋白重鏈基因外顯子1編碼序列或任何其它的編碼序列(包括合成的和人造的序列),而且它們將編碼異源編碼序列融合蛋白的N末端。這種N末端的作用如同一個前導(dǎo)區(qū)或信號序列協(xié)助異源序列的表達(dá)?;蛘撸谄渌鼘嵤┓桨钢?,附加的異源序列的插入位點(如,單一限制位點或多接頭)可被插入到內(nèi)含子1的起始位置的5’,使得編碼各種N末端序列(如,前導(dǎo)序列或信號序列)的序列可任意插入。ATG密碼子可作為載體的一部分,或作為所插入異源序列的一部分。
然而,并沒有必要在內(nèi)含子1之前保留ATG密碼子或其它密碼子。然而,在一些實施方案中,ATG密碼子可在外顯子2中存在或可由異源編碼序列提供。在這樣的實施方案中,異源序列插入位點可在外顯子2中存在或位于內(nèi)含子1/外顯子2連接處,而且提供的ATG密碼子或者作為載體的一部分,或是插入的異源序列的一部分。但是,在所有載體中包含內(nèi)含子1的實例中,必須保留內(nèi)含子1的剪接供體和剪接受體的序列,或等同的剪接供體和剪接受體序列,所以內(nèi)含子序列是轉(zhuǎn)錄后被去除的。如同在此描述的,內(nèi)含子內(nèi)的其它序列可被缺失或改變,或者可插入額外序列。在保留內(nèi)含子的結(jié)構(gòu)中,不管在內(nèi)含子1的5’還是3’,異源編碼區(qū)的插入都不能破壞剪接供體和受體位點,必須重建剪接供體和受體位點或必須提供相當(dāng)?shù)募艚庸w和受體位點。
最后,由于鐵蛋白重鏈基因外顯子1在ATG的3’(大約在位置-138到-111)也包含一種鐵調(diào)節(jié)元件(IRE),該元件依賴鐵的水平負(fù)性調(diào)控(control)翻譯(Klausner等(1993),Cell 7219-26綜述),所以基因座載體的創(chuàng)建可任選地包括從近端5’調(diào)節(jié)序列缺失IRE。
B.鐵蛋白重鏈編碼區(qū)一般,基因座載體將不包括鐵蛋白重鏈基因的任何編碼區(qū)。但是,依賴創(chuàng)建本載體的方法,可有意或作為副產(chǎn)物來包括鐵蛋白重鏈基因編碼區(qū)。例如,如果旨在僅用遠(yuǎn)端5’側(cè)翼序列和/或近端5’調(diào)節(jié)序列將完整的鐵蛋白重鏈基因區(qū)(一起為“5’鐵蛋白序列”)克隆到一個載體中,編碼區(qū)可有意地被全部缺失?;蛘撸愒葱蛄械牟迦胛稽c(如,單一限制位點或多接頭)以及近端3’調(diào)節(jié)序列(及任選地遠(yuǎn)端3’側(cè)翼序列)可插入緊鄰5’鐵蛋白序的3’處而不缺失編碼區(qū)。由于干預(yù)性插入,編碼區(qū)失活。同樣,所有的編碼區(qū)除了起始密碼子外都將被缺失或,或者,異源序列插入位點以及近端3’調(diào)節(jié)序列(及任選地遠(yuǎn)端3’側(cè)翼序列)可插入緊接起始密碼子3’處。此外,在異源序列插入位點以及近端3’調(diào)節(jié)序列(及任選地遠(yuǎn)端3’側(cè)翼序列)插入之前,能保留編碼區(qū)的更大一部分所以能產(chǎn)生融合蛋白。最后,這樣應(yīng)用前述方法的組合以致鐵蛋白重鏈基因編碼區(qū)通過插入干預(yù)序列可部分被缺失及部分失活。但是,在一些實施方案中,為了減小載體的大小,可缺失失活的及未翻譯的序列。
C.異源序列插入位點。
本發(fā)明的高表達(dá)基因座載體在近端5’調(diào)節(jié)序列的下游包括異源序列的插入位點諸如多接頭位點。異源序列的插入位點可以是這樣的序列,其能使以一種異源序列充分受控的和可預(yù)測的方式插入,從而以合理的成功的期望值產(chǎn)生功能性的高表達(dá)基因座載體。異源序列的插入位點可包括同源重組、定點整合(site-directed integration)(如,通過轉(zhuǎn)座子或病毒構(gòu)建體)或核酸內(nèi)切酶介導(dǎo)的限制性。插入位點的長度可從4bp(在使用四切(four cutter)的限制性內(nèi)切核酸酶時)變化到1,000bp或5,000bp(用于同源重組方法)。然而,在一些情況下,近端5’調(diào)節(jié)序列的3’末端和近端3’調(diào)節(jié)序列的5’末端可以形成一個插入位點而無需在它們之間包含額外的核苷酸。因此,例如,近端5’調(diào)節(jié)序列的最后兩個核苷酸和近端3’調(diào)節(jié)序列的最初兩個核苷酸能形成一個4bp的限制性位點,其可作為異源序列的一個插入位點?;蛘?,在這些序列之間僅需要有一個或幾個核苷酸就可形成一個插入位點。因此,插入位點的長度除了上述可為4bp到5,000bp,也可以為0、1、2或3bp。
在一些實施方案中,異源序列插入位點可包括在有義鏈或反義鏈上的一個或多個核苷酸序列,作為天然或人工內(nèi)切酶的限制性位點。這些限制性位點在載體中可以是唯一的,而且插入位點可以是包括多種這樣的限制性位點的多接頭,該接頭可更靈活的應(yīng)用不同的限制性內(nèi)切核酸酶。實施例1和圖3提供了一個這樣的多接頭的實施例。
D.近端3’調(diào)節(jié)序列。
本發(fā)明的高表達(dá)基因座載體在包括異源序列的插入位點的下游近端3’調(diào)節(jié)序列。這些序列最小包括一種聚腺苷酸化信號。在一些實施方案中,近端3’調(diào)節(jié)序列也包括轉(zhuǎn)錄終止信號。在一些實施方案中,這些序列可包括翻譯終止密碼子,然而在其它實施方案中,終止密碼子可被包含在異源序列插入序列中。
近端3’調(diào)節(jié)序列可來自鐵蛋白重鏈基因但不是必需的。例如,在一些實施方案中,基因座載體的近端3’調(diào)節(jié)序列可包括至少10-2,000個堿基的核苷酸的序列,后者與鐵蛋白重鏈基因座近端3’側(cè)翼序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%-100%的同一性。因此,在一些實施方案中,近端3’調(diào)節(jié)序列可包含至少10、25、50、100、500、750、1,000或2,000個核苷酸,其與鐵蛋白重鏈基因座近端3’調(diào)節(jié)序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。在其它實施方案中,近端3’調(diào)節(jié)序列基本上由一種聚腺苷酸化信號組成,該聚腺苷酸化信號可以來自鐵蛋白重鏈基因,異源序列或是合成的或者人工的序列。
在其它的實施方案中,基因座載體的近端3’調(diào)節(jié)序列將與相應(yīng)的鐵蛋白重鏈基因序列具有更低百分比的同一性,而且,在一些實施方案中,近端3’調(diào)節(jié)序列將與任何相應(yīng)的鐵蛋白重鏈基因序列無關(guān)。
E.遠(yuǎn)端3’側(cè)翼序列。
本發(fā)明的高表達(dá)基因座載體任選地包括近端3’調(diào)節(jié)序列下游的遠(yuǎn)端3’側(cè)翼序列。遠(yuǎn)端3’側(cè)翼序列可來自鐵蛋白重鏈基因但不是必需的。例如,在一些實施方案中,基因座載體的遠(yuǎn)端3’側(cè)翼序列可包括至少100-100,000個核苷酸的序列,后者與鐵蛋白重鏈基因座遠(yuǎn)端3’側(cè)翼序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%-100%的同一性。因此,在一些實施方案中,遠(yuǎn)端3’側(cè)翼序列可包含至少100、500、750、1,000、10,000、25,000、50,000或100,000個核苷酸,其與鐵蛋白重鏈基因座遠(yuǎn)端3’側(cè)翼序列內(nèi)發(fā)現(xiàn)的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。如在以下實施例顯示,遠(yuǎn)端3’側(cè)翼序列可包括1,000-10,000bp、2,000-9,000bp、3,000-8,000bp或4,000-7,000bp的側(cè)翼序列。
在其它的實施方案中,基因座載體的遠(yuǎn)端3’側(cè)翼序列可與相應(yīng)的鐵蛋白重鏈基因序列具有更低百分比的同一性,而且,在一些實施方案中,遠(yuǎn)端3’側(cè)翼序列可與任何相應(yīng)的鐵蛋白重鏈基因序列無關(guān)。
下面的實施方案示出了實施本發(fā)明的一些詳盡的方式,但不旨在限制本發(fā)明的權(quán)利要求范圍??衫昧硗獾牟牧虾头椒ǐ@得相似的結(jié)果。
實施例1鐵蛋白重鏈基因座載體的創(chuàng)建。
為產(chǎn)生基于鐵蛋白重鏈基因的高表達(dá)基因座載體,采用了三個研發(fā)階段(1)克隆具有基本的(substantial)5’和3’區(qū)鐵蛋白重鏈基因;(2)產(chǎn)生基于這些基因區(qū)的至少一種的表達(dá)載體,以及(3)載體的最優(yōu)化。如上提及的,許多其它的方法可以用來產(chǎn)生相同或等同的基因座載體。
首先,將粘粒15A的含有鐵蛋白重鏈外顯子的區(qū)域亞克隆入載體Litmus 38(New England Biolabs)產(chǎn)生質(zhì)粒pFerX1(圖2)。從粘粒15A中分離出BamHI-XhoI片段,并與用BamHI和SalI消化的Litmus 38連接從而產(chǎn)生質(zhì)粒pFerX1。注意粘粒15A僅部分測序而且一些限制性位點的位置是基于限制酶切作圖的。因此一些限制性位點的位置可能并不精確。
圖3示出了從pFerX1缺失含有外顯子2,3,4的片段并插入含有AatII及SalI限制性位點的多接頭從而產(chǎn)生質(zhì)粒pFerX2。缺失的HpaI片段從插入序列的HpaI位點延伸到pFerX1的載體的HpaI位點。多接頭的5’末端再生HpaI位點,但3’末端沒有再生該位點。用PCR篩選接頭的取向。
從pFerX2中缺失外顯子1編碼區(qū),保持ATG起始密碼子及以下剪接受體完整從而產(chǎn)生質(zhì)粒pFerX3。圖4示出了外顯子1編碼區(qū)的缺失是通過從pFerX2中分離BamHI-BspHI(2515-2719)及NcoI-BamHI(2830-2515)片段實現(xiàn)的。BspHI及NcoI產(chǎn)生匹配的突出端,其允許合成片段連接在一起產(chǎn)生pFerX3。這種操作的結(jié)果是載體的外顯子1從BspHICCAGCCGCCATC ATG ACC ACC GCG TCT CCC TCG CAA GTG CGC CAG AAC TAC CAC CAG GAC TCG GAG GCTGGTCGGCGGTAG TAC TGG TGG CGC AGA GGG AGC GTT CAC GCG GTC TTG ATG GTG GTC CTG AGC CTC CGAMet Thr Thr Ala Ser Pro Ser Gln Val Arg Gln Asn Tyr His Gln Asp Ser Glu AlaNcoI剪接供體GCC ATC AAC CGC CAG ATC AAC CTG GAG TTG TAT GCC TCC TAC GTC TAT CTG TCC ATG GTGAGTGCGGCCTCGG TAG TTG GCG GTC TAG TTG GAC CTC AAC ATA CGG AGG ATG CAG ATA GAC AGG TAC CACTCACGCCGGAAla Ile Asn Arg Gln Ile Asn Leu Glu Leu Tyr Ala Ser Tyr Val Tyr Leu Ser Met變化為剪接供體CCAGCCGCCATC ATG GTGAGTGCGGCCTGGTCGGCGGTAG TAC CACTCACGCCGGAMet外顯子1IRE的缺失通過在pFerX3中用不含IRE的接頭(但創(chuàng)建了一個5′KpnI位點用于篩選)替代SacII-EagI(2575-2639)片段從而產(chǎn)生質(zhì)粒pFerX4而實現(xiàn)的。這種操作的結(jié)果是載體的外顯子1(IRE用下劃線顯示)從SacII(2575) EagI(2639)CAGAGTCGCCGCGGTTTCCTGCTTCAACAGTGCTTGAACGGAACCCGGTGCTCGACCCCTCCGACCCCCGTCCGGCCGCTTTGAGCCGTCTCAGCGGCGCCAAAGGACGAAGTTGTCACGAACTTGCCTTGGGCCACGAGCTGGGGAGGCTGGGGGCAGGCCGGCGAAACTCGG變化為(接頭用粗體顯示)KpnI(2579)SacII(2575) EagI(2611)CAGAGTCGCCGCGGTACCGGTGCTCGACCCCTCCGACCCCCGTCCGGCCGCTTTGAGCCGTCTCAGCGGCGCCATGGCCACGAGCTGGGGAGGCTGGGGGCAGGCCGGCGAAACTCGG以三步法產(chǎn)生PCR融合產(chǎn)物,用含有SwaIand NotI的多接頭替代外顯子2到4,同時保留鐵蛋白重鏈基因的近端5’調(diào)節(jié)序列以及近端3’調(diào)節(jié)序列。如圖5(A)顯示,第一次PCR用粘粒15A(圖2)作為模板。引物Fer1和Fer4的引物定位如箭頭所示。引物FN1及FN2的“引發(fā)(priming)”區(qū)也用條形表示。第二步,如圖5(B)顯示,產(chǎn)生了Fer1-FN2的PCR產(chǎn)物。示出了引物Swa-2“引發(fā)”區(qū)的定位。第三步,如圖5(C)顯示,產(chǎn)生了一種FN1-Fer4的PCR產(chǎn)物。示出了引物Swa-1“引發(fā)”區(qū)的定位。第四步以及最后一步,如圖5(D)顯示,用Fer1-Swa-2及Swa-1-Fer4產(chǎn)物作為模板以及用引物Fer1及Fer4產(chǎn)生最終的PCR融合產(chǎn)物。使該產(chǎn)物中分離出的HpaI-AatII片段插入pFerX4的HpaI及AatII位點產(chǎn)生質(zhì)粒pFerX5(見圖6)。前三步用到的產(chǎn)生SwaI-NotI多接頭的PCR融合反應(yīng)如表1所示。
表1
PCR引物如下所示,多接頭序列用粗體顯示,F(xiàn)N1及FN2之間或Swa-1及Swa-2之間的互補(bǔ)序列用下劃線顯示。
NheI NotI AatIIFN1ACTTTCAGCTGCTAGCGGCCGCGCTGACGTCCCCAAGGCCATNotI NheIFN2ACGTCAGCGCGGCCGCTAGCAGCTGAAAGTGGAAAGGGTATSwaI NotI AatIISwa-1CTTTCCATTTAAATCTGCTAGCGGCCGCTGACGTCSwaISwa-2TAGCAGATTTAAATGGAAAGGGTATTTGTTATTGATC用SwaI平端切割質(zhì)粒并插入含有AscI位點的雙鏈寡核苷酸(oligo)GGCGCGCCCCGCGCGG來去除pFerX4的載體骨架的SwaI位點從而產(chǎn)生質(zhì)粒pFerX4.1。從載體骨架去除SwaI位點目的是使SwaI位點在上述多接頭中唯一。
pFerX4.1的載體骨架(其中圖15的AscI oligo的插入破壞了載體骨架的SwaI位點)以及pFerX5的載體骨架(在骨架區(qū)和多接頭位點包含SwaI位點)用SacII-AatII片段交換來產(chǎn)生質(zhì)粒pFerX5.1(圖7)。pFerX5.1含有多接頭但在骨架區(qū)缺少SwaI位點,使多接頭的SwaI位點唯一。
多接頭BglII BstBICTGTGAGATCTGTTCGAATGGTGCAGACACTCTAGACAAGCTTACCAGCTAatIISalI匹配的 匹配的被插入到pFerX5.1的SalI-AatII位點產(chǎn)生質(zhì)粒pFerX6。多接頭包括BglII和BstBI位點,它被設(shè)計成接受(receive)鐵蛋白重鏈基因的遠(yuǎn)端3’側(cè)翼序列。
鐵蛋白重鏈基因的遠(yuǎn)端3’側(cè)翼序列(粘粒15A的AatII-BamHI片段)被插入到pFerX6的AatII-BglII位點產(chǎn)生質(zhì)粒pFerX7(圖8)。
鐵蛋白重鏈基因的遠(yuǎn)端5’側(cè)翼序列(pFerH1的BamHI片段,粘粒15A的亞克隆,圖2BamHI 10269-15176)被插入到pFerX7的BamHI位點產(chǎn)生質(zhì)粒pFerX8(圖9)。
各種形成pFerX8的序列的起源如圖10所示。Litmus 38骨架用實心框表示。該質(zhì)粒含有在起始ATG密碼子之前的>6kb的遠(yuǎn)端5’側(cè)翼序列以及在終止密碼子之后的~7kb的遠(yuǎn)端3’側(cè)翼序列。SwaI及NotI克隆位點分別位于位置10240及10254。插入SwaI及NotI位點的編碼區(qū)在5’端應(yīng)該是平端的(SwaI端),并應(yīng)以堿基CAG起始再產(chǎn)生剪接受體然后是第二個氨基酸。NotI位點應(yīng)位于終止密碼子之后的3’末端。
遠(yuǎn)端5’側(cè)翼序列的附加片段(粘粒15A的BspEI片段)被插入到pFerX8的BspEI位點(6037)產(chǎn)生質(zhì)粒pFerX9(圖11,BspEI片段6034-14211)。這種插入除了重復(fù)了在pFerX8中已存在的遠(yuǎn)端5’側(cè)翼序列的片段(10697-13990與2520-5813相同)還添加了遠(yuǎn)端5’側(cè)翼序列的獨特(unique)片段。這種質(zhì)粒并非完全測序,一些限制性位點的位置是基于限制性片段大小估計的。
質(zhì)粒pFerX8及pFerX9的轉(zhuǎn)錄區(qū)的序列如圖12所示。示出了推定的轉(zhuǎn)錄起始位點。內(nèi)含子以小寫字體顯示。推定的TATA及聚腺苷酸化信號用下劃線表示。起始密碼子在第一個外顯子中而且插入的基因從第二個氨基酸開始插入到SwaI及NotI位點。
實施例2異源序列的表達(dá)A.報告基因報告基因被插入到質(zhì)粒pFerX8及pFerX9的多接頭中的SwaI-NotI位點。分泌型堿性磷酸酶被選作一種報告基因,因為產(chǎn)物的可購得的測定法簡便而且快速。表達(dá)載體命名為pFerX8SEAP及pFerX9SEAP。
載體多接頭的序列以及需要被重建從而再生出剪接供體的外顯子2的5’末端的原始序列如圖5所示。因此,5’引物應(yīng)包括5’末端的CAG用于重建天然的剪接供體,其后是起始于第二個氨基酸的編碼區(qū)(ATG已包括在外顯子1內(nèi))。PCR產(chǎn)物的5’末端應(yīng)保持平端以使與SwaI位點連接。例如一般5’引物CAGNNN NNN NNN NNN NNN NNN NNNAA2 AA3 AA4 AA5 AA6 AA7 AA8SEAP例子的引物CAGCTG CTG CTG CTG CTG CTG CTG GGC3’引物應(yīng)包括NotI位點,隨后是包括終止密碼子(相反鏈)的基因的3’末端。PCR產(chǎn)物應(yīng)該用NotI消化產(chǎn)生與多接頭的NotI位點匹配的末端。例如一般5’引物NNNN GCGGCCGC NNNNNN NNN NNN NNN NNN NNNNotI 基因3’末端位點SEAP例子的引物(終止密碼子為粗體)TTTT GCGGCCGC AGCTCA TGT CTG CTC GAA GCG GCCPCR產(chǎn)物與載體(用SwaI及NotI消化)的連接并不在插入序列5’末端重新產(chǎn)生(recreate)SwaI位點。而連接產(chǎn)物在“SwaI末端”含有一個合適的剪接受體。插入?yún)^(qū)也包含從第二個氨基酸到終止密碼子的編碼區(qū),其后為3’末端的NotI位點。例如,一般在連接后CCATTT CAGNNN NNN NNN //NNN NNN NNNGCGGCCGC TGACGT對SEAP的例子CCATTT CAGCTG CTG CTG //CAG ACA TGAGCGGCCGC TGACGTB.轉(zhuǎn)染用于轉(zhuǎn)染的宿主是CHO DG44(E)細(xì)胞系(Urlaub等(1986),Somatic CellMol.Gen.12555-566),其已被選作在無血清培養(yǎng)基中生長并存活。這種細(xì)胞系在轉(zhuǎn)瓶(spinner flask)中用加入核苷的無血清培養(yǎng)基維持。用于轉(zhuǎn)染的細(xì)胞以指數(shù)生長。每次轉(zhuǎn)染用2×106或5×106個細(xì)胞。
報告質(zhì)粒與編碼二氫葉酸還原酶(DHFR)命名為pSI-DHFR.2的質(zhì)粒共轉(zhuǎn)染以至于能在DHFR-宿主中選出穩(wěn)定轉(zhuǎn)染子。pSI-DHFR.2質(zhì)粒包括一個篩選標(biāo)志由SV40啟動子驅(qū)動(SV40增強(qiáng)子缺失)的dhfr基因(圖13)。
所有的DNA由Megaprep試劑盒(Qiagen,Valencia CA)制備。在轉(zhuǎn)染DNA之前,用EtOH沉淀,用70%EtOH洗滌,干燥,重懸于HEBS(20mMHepes pH7.05,137mM NaCl,5mM KCl,0.7mM Na2HPO4,6mM右旋糖),并在轉(zhuǎn)染DNA之前定量。用帶有SV40早期啟動子/增強(qiáng)子表達(dá)SEAP的質(zhì)粒(pSEAP2,Clontech,Palo Alto,CA)作為陽性對照組。陰性對照組包括空pUC18載體(ATCC#37253,美國典型培養(yǎng)物保藏中心(American TypeCulture Collection),Manasssas,VA)作為報告物(reporter)對照并以無DNA轉(zhuǎn)染作為轉(zhuǎn)染對照。
每次轉(zhuǎn)染都包含50μg的報告質(zhì)粒及5μg的pSI-DHFR。選擇相等的質(zhì)粒重量而非相等的摩爾量。從體積摩爾濃度(molarity)角度,對照報告組與測試報告組有3-5倍級數(shù)的不同(表3)。在每種情況下,測試報告組均比對照報告組低。
表3
細(xì)胞及DNA用0.4cm的比色杯(cuvette)(BioRad,Hercules,CA)在0.8ml的HEBS中以0.28kV及950μF通過電穿孔進(jìn)行轉(zhuǎn)染。在電穿孔脈沖后,細(xì)胞可以在比色杯室溫溫育5-10分鐘。然后將它們轉(zhuǎn)移到離心管中,該管包含10%dFBS(HyClone,Logan,UT)的10ml加上核苷的Alpha-MEM(GIBCO,Gaithersburg,MD)以1K rpm沉淀5分鐘。重懸的沉淀接種于T形瓶(包含10%dFBS的無核苷的Alpha-MEM)在36℃ 5%CO2濕化孵箱中溫育直至菌落形成。
表4總結(jié)了所進(jìn)行的七個試驗。轉(zhuǎn)染1-3每個以一式三份進(jìn)行,轉(zhuǎn)染4-7每個進(jìn)行一次。
表4
C.轉(zhuǎn)染效率轉(zhuǎn)染大約兩周后,菌落形成。穩(wěn)定轉(zhuǎn)染子可作為集合體或者分離體來分析。盡管所有的含有pSI-DHFR.2的轉(zhuǎn)染產(chǎn)生菌落,含鐵蛋白重鏈基因座載體的轉(zhuǎn)染產(chǎn)生的菌落比對照要少。不論基因座載體是否表達(dá)產(chǎn)物,這是真實的。由于每次轉(zhuǎn)染包括等量的DNA,所以這些結(jié)果是令人吃驚的。由于轉(zhuǎn)染效率不同,推薦進(jìn)行多重轉(zhuǎn)染來解決轉(zhuǎn)染子數(shù)目減少的問題。
D.SEAP測定含有SEAP基因的報告構(gòu)建體用Great EscAPeTMSEAP ReporterSystem3(Clontech,Palo Alto,CA)分析。這種測定方法是用一種熒光底物檢測在條件培養(yǎng)基中SEAP的活性。根據(jù)生產(chǎn)廠商的用法說明以96孔格式使用這個試劑盒,而且具有以下不同。所有的標(biāo)準(zhǔn)品和樣品在新鮮的培養(yǎng)基中稀釋而不是用所提供的稀釋緩沖液稀釋。并非60分鐘后讀一次數(shù),而是每隔10-20分鐘多次讀數(shù),以每分鐘的相對熒光單位(RFU/min)表示SEAP的活性。用于Cytofluor II平板讀出器的發(fā)射濾波是460nm而不是推薦的449nm。
下面的集合體及分離體產(chǎn)生的所有數(shù)據(jù)是基于表達(dá)SEAP的報告構(gòu)建體。報告的滴度是基于試劑盒的陽性對照。盡管絕對值不是推理得出的,相對滴定度值是有用的。
在測定中估計比產(chǎn)率(specific productivity),其中將培養(yǎng)基更換為新鮮培養(yǎng)基,在24小時后取樣培養(yǎng)基,并計數(shù)細(xì)胞。產(chǎn)物滴度標(biāo)準(zhǔn)化為24小時測定末的細(xì)胞數(shù)目。因為滴度是相對的,比生產(chǎn)率表示為相對值。
E.轉(zhuǎn)染子的集合體在菌落出現(xiàn)后,收集并匯總每種轉(zhuǎn)染的細(xì)胞。接種該集合體到6孔板或T形瓶并在24小時測定中保持分會合。集合體測定結(jié)果如圖14所示。每種構(gòu)建體分析了五個集合體,兩個來自試驗1(1A和1B),三個來自試驗2(2A,2B以及2C)。所有的測定在轉(zhuǎn)染后三到四個星期后進(jìn)行。注意用pFerX8SEAP的試驗2C相對于其它轉(zhuǎn)染具有很低的轉(zhuǎn)染效率。
利用對照組(pSEAP2)的比生產(chǎn)率相當(dāng)一致,但是利用pFerX8SEAP及pFerX9SEAP載體的比生產(chǎn)率高度可變。特別是,鐵蛋白載體能產(chǎn)生具有比對照組的比生產(chǎn)率更高的集合體。
F.轉(zhuǎn)染子的分離體分離體是從轉(zhuǎn)染試驗#2“挑取(picking)”菌落獲得的?!疤羧 笔峭ㄟ^用P200Pipetman在50μl檔在直接吸出菌落而獲得的。吸出的菌落先轉(zhuǎn)移到一個48孔板當(dāng)有足夠數(shù)目的細(xì)胞時轉(zhuǎn)移到6孔板上。在6孔板中在接近會合到會合的細(xì)胞密度用上述的24小時測定法測定比生產(chǎn)率。每個構(gòu)建體分析40-50個分離體。結(jié)果如圖15所示,其中分離體按它們對于每種SEAP表達(dá)構(gòu)建體的比產(chǎn)率的順序示出。用于比較的組(panel)的比產(chǎn)率等級是一致的。
pSEAP2轉(zhuǎn)染的分離體大部分(63%)不表達(dá)超出檢測界限的產(chǎn)物。在這個試驗中pSEAP2的最高生產(chǎn)率是每天每個細(xì)胞46個單位(用于比較的相對值)。相反,pFerX8SEAP轉(zhuǎn)染的分離體僅有28%表達(dá)低于檢測界限的產(chǎn)物,而其中44%的生產(chǎn)率超過最高的pSEAP2轉(zhuǎn)染子。本試驗中pFerX8SEAP的最高生產(chǎn)率是每天每個細(xì)胞259單位,是pSEAP2的最高生產(chǎn)率的五倍。盡管pFerX9SEAP構(gòu)建體比pSEAP2表現(xiàn)好,但它不如pFerX8SEAP。
實施例3載體大小的縮小為了縮小載體的大小便于使用,缺失載體的5’和/或3’區(qū)(表5)??扇缜坝肧EAP作為報告基因一樣來檢測這些缺失。對表5所示的每一種質(zhì)粒,以及對照pSEAP2及pUC18(10個分離體),檢測大約30個分離體。
表5
*缺失終點基于pFerX8序列編號。
**SEAP基因構(gòu)成該質(zhì)粒的1557bp。
pFerX11SEAP載體表現(xiàn)與pFerX8SEAP載體相似,表示在表5中所描述的~3.9kb的3’區(qū)缺失不是有損害的。pFerX10SEAP及pFerX12SEAP載體表現(xiàn)不如pFerX8SEAP,表示在表5中所描述的~4.9kb的5’缺失對功能是有損害的。
等同物雖然已經(jīng)參照本發(fā)明一些具體實施方案詳細(xì)地說明并描述了本發(fā)明,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明白可以在形式上和細(xì)節(jié)上進(jìn)行各種修改而不背離所附權(quán)利要求限定的本發(fā)明精神和范圍。本領(lǐng)域技術(shù)人員僅用常規(guī)試驗即可認(rèn)識到或能確定本發(fā)明在此具體描述的具體實施方案的許多等同物。這些等同物也應(yīng)在所附權(quán)利要求所覆蓋的范圍內(nèi)。
權(quán)利要求
1.用于在真核細(xì)胞內(nèi)進(jìn)行穩(wěn)定轉(zhuǎn)染并表達(dá)所需蛋白的基因載體,其包含(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)第一異源編碼序列的至少一個第一插入位點;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中所述序列以5’到3’的方向按(a)-(d)的順序可操作地連接,并且相鄰序列間有任選的接頭序列;以及其中(1)所述遠(yuǎn)端5’調(diào)節(jié)序列包含至少20個堿基的序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;或(2)所述近端5’側(cè)翼序列包含至少100個堿基的序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
2.用于在真核細(xì)胞內(nèi)進(jìn)行穩(wěn)定轉(zhuǎn)染并表達(dá)所需蛋白的基因載體,其包含(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)編碼所述所需蛋白的至少一種第一異源編碼序列;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中所述序列以5’到3’的方向按(a)-(d)的順序可操作地連接,并且相鄰序列間有任選的接頭序列;以及其中(1)所述遠(yuǎn)端5’側(cè)翼序列包含至少100個堿基的序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;或(2)所述近端5’調(diào)節(jié)序列包含至少20個堿基的序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
3.權(quán)利要求1-2中任一項的基因載體,其中所述遠(yuǎn)端5’側(cè)翼序列來自鐵蛋白重鏈基因座。
4.權(quán)利要求1-2中任一項的基因載體,其中所述近端5’調(diào)節(jié)序列來自鐵蛋白重鏈基因座。
5.權(quán)利要求1-2中任一項的基因載體,其中所述近端5’調(diào)節(jié)序列及所述遠(yuǎn)端5’側(cè)翼序列來自鐵蛋白重鏈基因座。
6.權(quán)利要求1-5中任一項的基因載體,其中所述近端3’調(diào)節(jié)序列來自鐵蛋白重鏈基因座。
7.權(quán)利要求1-6中任一項的基因載體,其還包含鐵蛋白重鏈基因座的遠(yuǎn)端3’側(cè)翼序列。
8.權(quán)利要求1及3-7中任一項的基因載體,其中異源序列的所述插入位點包含至少一個限制性核酸內(nèi)切酶位點。
9.權(quán)利要求8的基因載體,其中異源序列的所述插入位點是包含至少兩個限制性核酸內(nèi)切酶位點的多接頭位點。
10.權(quán)利要求1-9中任一項的基因載體,其中所述近端5’調(diào)節(jié)序列包含真核內(nèi)含子序列。
11.權(quán)利要求10的基因載體,其中所述真核內(nèi)含子序列來自鐵蛋白重鏈基因的內(nèi)含子1。
12.權(quán)利要求1-11中任一項的基因載體,其中所述近端5’調(diào)節(jié)序列包含未翻譯的外顯子序列。
13.權(quán)利要求1-12中任一項的基因載體,其中所述遠(yuǎn)端5’側(cè)翼序列和所述近端5’調(diào)節(jié)序列的總長度在1,000到10,000個堿基之間。
14.權(quán)利要求1-12中任一項的基因載體,其中所述近端3’調(diào)節(jié)序列和任何遠(yuǎn)端3’側(cè)翼序列的總長度在1,000到10,000個堿基之間。
15.真核細(xì)胞,其由權(quán)利要求1-14中任一項的載體轉(zhuǎn)染。
16.權(quán)利要求15的真核細(xì)胞,其中所述載體已穩(wěn)定地整合到該細(xì)胞的染色體中。
17.權(quán)利要求15-16中任一項所述真核細(xì)胞,其中所述第一編碼序列在該細(xì)胞中表達(dá)。
18.真核細(xì)胞,其包含(a)真核基因座的遠(yuǎn)端5’側(cè)翼序列;(b)真核基因座的近端5’調(diào)節(jié)序列;(c)至少一種第一編碼序列;以及(d)近端3’調(diào)節(jié)序列,其對真核基因座的轉(zhuǎn)錄終止有效;其中所述序列以5’到3’的方向按(a)-(d)的順序可操作地連接,并且相鄰序列間有任選的接頭序列;以及其中(1)所述遠(yuǎn)端5’側(cè)翼序列包含至少100個堿基的外源序列,后者具有與在自鐵蛋白重鏈基因座轉(zhuǎn)錄起始位點5’起的20bp與100,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性;或(2)所述近端5’調(diào)節(jié)序列包含至少20個堿基的外源序列,后者具有與在自鐵蛋白重鏈基因座翻譯起始密碼子5’起的1bp與10,000bp之間發(fā)現(xiàn)的核苷酸序列至少70%的同一性。
19.真核細(xì)胞,其包含來自鐵蛋白重鏈基因座的外源性5’遠(yuǎn)端側(cè)翼序列,其與編碼序列可操作地連接。
20.在真核細(xì)胞中產(chǎn)生所需蛋白的方法,其包括(a)提供至少一種按權(quán)利要求15-19中任一項所述的細(xì)胞或其后代;(b)在允許高表達(dá)所述所需蛋白的條件下將所述細(xì)胞維持在培養(yǎng)基中;以及(c)從所述培養(yǎng)基分離該所需蛋白。
全文摘要
本發(fā)明公開了部分基于鐵蛋白重鏈基因座的高表達(dá)基因座載體。這種載體包含來自鐵蛋白重鏈基因座的遠(yuǎn)端5’側(cè)翼序列和/或近端5’調(diào)節(jié)序列。這種載體包含異源序列、近端3’調(diào)節(jié)序列和遠(yuǎn)端3’側(cè)翼序列的插入位點。近端3’調(diào)節(jié)序列和遠(yuǎn)端3’側(cè)翼序列任選地來自鐵蛋白重鏈基因座。本發(fā)明還公開了載體轉(zhuǎn)化的細(xì)胞以及產(chǎn)生載體編碼的異源蛋白質(zhì)的方法。
文檔編號C12N15/64GK1732258SQ200380107498
公開日2006年2月8日 申請日期2003年10月22日 優(yōu)先權(quán)日2002年10月24日
發(fā)明者霍利·普倫蒂斯 申請人:比奧根艾迪克Ma公司