專利名稱:包含trp基因破壞的轉基因小鼠的制作方法
技術領域:
本發(fā)明涉及轉基因動物、與基因功能鑒定相關的組合物和方法。
背景技術:
在人類基因組中已經(jīng)鑒定出許多多態(tài)三核苷酸重復。這些突變由可遺傳的不穩(wěn)定DNA產(chǎn)生,被稱為“動態(tài)突變”,因為在世代之間遺傳的重復單位的數(shù)目是變化的(Koshy等,Brain Pathol,7927-42(1997))。雖然這些重復是高度多態(tài)性的,但其數(shù)量在正常個體中通常不超過40個重復(Online Mendelian Inheritance in Man,OMIM(TM).Johns Hopkins University,Baltimore,MD.MIM Number603279jlewis7/14/1999;World Wide Web URLhttp//www.ncbi.nlm.nih.gov/omim;Koshy等(1997))。
相比之下,已經(jīng)發(fā)現(xiàn)異常擴增的三核苷酸重復引起疾病(OMIM603279)。致病的擴增通常含有超過40個三核苷酸重復,已經(jīng)報道了200個或更多重復的序列段(OMIM 603279;Slegtenhorst-Eegdeman等,Endocrinology,139156-62(1998))。已經(jīng)鑒定出四種類型的三核苷酸重復擴增(1)兩種脆性X染色體綜合征(FRAXA和FRAXE)中的長胞嘧啶-鳥嘌呤-鳥嘌呤(CGG)重復,(2)肌強直性營養(yǎng)不良中的長胞嘧啶-胸腺嘧啶-鳥嘌呤(CTG)重復擴增,(3)Friedreich共濟失調中的長鳥嘌呤-腺嘌呤-腺嘌呤重復擴增,和(4)涉及神經(jīng)變性性疾病的短胞嘧啶-腺嘌呤-鳥嘌呤重復擴增(CAG)。(Koshy等(1997))。
分類為1型和2型疾病的至少12種疾病由三核苷酸擴增突變所致,大多數(shù)具有神經(jīng)精神特征(Margolis等,Hum Genet.,100114-122(1997))。1型疾病由可讀框中的(CAG)n擴增引起,產(chǎn)生擴增的谷氨酰胺重復。1型疾病包括1型脊髓小腦性共濟失調(SCAl,Orr等,NatGenet,4221-6(1993))、SCA2(Imbert等,Nat Genet,14285-91(1996);Pulst等,Nat Genet,14269-76(1996);Sanpei等,Nat Genet,14277-84(1996))、Machado-Joseph病(MJD或SCA3,Kawaguchi等,Nat Genet,8221-8(1994))、SCA6(Zhuchenko等,Nat Genet,1562-9(1997))、dentatutorubral pallidoluysioan atrophy(DRPLA,Koide等,Nat Genet,69-13(1994))、亨廷頓舞蹈病(HD,Huntington’s Disease CollaborativeResearch Group,Cell,72971-83(1993))和脊髓延髓性肌萎縮(SBMA,LaSpada,Nature,35277-9(1991))。2型疾病可以由5’非翻譯區(qū)中的擴增(Jacobsen綜合征,Jones等,Nature,376145-9(1995);脆性X染色體綜合征,F(xiàn)u等,Science,1992 2551256-8(1992))、3’非翻譯區(qū)中的擴增(肌強直性營養(yǎng)不良,Brook等,Cell,68799-808(1992);Philips等,Science,280737-41(1998))和內含子區(qū)中的擴增(Fredreich共濟失調,Campuzano等,Science,2711423-7(1996))引起。然而,對于擴增事件的機理和發(fā)生時間知之甚少(Bates等,Hum Mol Genet.,61633-7(1997))。
由三核苷酸重復擴增引起的疾病表現(xiàn)出稱為早現(xiàn)遺傳的現(xiàn)象,這種現(xiàn)象不能用傳統(tǒng)的孟德爾遺傳學來解釋(Koshy等(1997))。早現(xiàn)遺傳的定義是在連續(xù)世代中疾病的嚴重程度增加并且癥狀出現(xiàn)的年齡更早。早現(xiàn)遺傳通常受遺傳親代性別的影響,對于大多數(shù)CAG重復性疾病而言,當為母性遺傳時這種疾病更為嚴重。該病的嚴重程度和發(fā)病年齡與重復序列的大小有關(Koshy等(1997))。較大的擴增導致更早發(fā)病和臨床表現(xiàn)更為嚴重。早現(xiàn)遺傳的現(xiàn)象已經(jīng)使人們懷疑,所述擴增重復的不穩(wěn)定性是特定疾病的基礎(OMIM 603279)。
帶有擴增的三核苷酸重復序列段的蛋白質是不相關的,并且廣泛表達,而且表達模式廣泛重疊(Bates等(1997))。大多數(shù)蛋白是新的,但雄激素受體和電壓門控αlA鈣通道例外,它們在脊髓延髓性肌萎縮和6型脊髓小腦性共濟失調中有突變。有趣的是,CAG重復蛋白在周圍神經(jīng)組織和中樞神經(jīng)組織中均廣泛表達,但在每種神經(jīng)病中,僅一個選定的神經(jīng)細胞群體由于所述擴增的重復而成為變性的靶(Koshy等(1997))。
尚不了解擴增導致神經(jīng)元機能障礙和細胞死亡的機理(Bates等(1997))。目前的看法是,重復序列段的存在使所涉及的基因、信使或蛋白質獲得功能。例如,已假定肌強直性營養(yǎng)不良基因(MD)轉錄物的擴增CUG重復區(qū)與CUG結合蛋白的不當相互作用逐漸演變出(titrate-out)通常構成(comprise)不均一核內核糖核蛋白顆粒的蛋白質(Bhagwati等,Biochim Biophys Acta,1317155-7(1996);Philips等(1998))。也已經(jīng)提出,產(chǎn)生新型蛋白質-蛋白質相互作用或異常的蛋白質折疊以及側翼基因表達和染色質結構的改變是三核苷酸擴增可能致病的機理(Thomton等,Nat.Genet.,16407-9(1997))。
三核苷酸重復性疾病的小鼠模型對于揭示這些疾病的分子基礎和開發(fā)治療干涉而言有很大潛力和前景。轉基因小鼠再現(xiàn)了人類疾病的許多特征,因而是研究體內疾病發(fā)展的優(yōu)良模型系統(tǒng)。應用這種小鼠,將有可能在所述小鼠中對致病機理和三核苷酸重復的不穩(wěn)定性進行建模(Bates等(1997))。
發(fā)明概要本發(fā)明總的來說涉及轉基因動物以及與基因功能鑒定相關的組合物和方法,更具體地講,本發(fā)明涉及編碼三核苷酸重復蛋白(TRP)的基因,例如基因T243。
本發(fā)明提供在編碼TRP的靶DNA序列中包含破壞的細胞,優(yōu)選干細胞,更優(yōu)選胚胎干(ES)細胞。最好是,所述靶DNA序列是T243。在一個優(yōu)選實施方案中,所述干細胞是鼠類ES細胞。按照一個實施方案,通過獲得與所述靶DNA序列同源的序列,并將所述序列插入打靶構建體中,產(chǎn)生所述破壞。然后將打靶構建體導入所述干細胞中,構建在所述靶DNA序列中產(chǎn)生破壞的同源重組體。
在一個更優(yōu)選的實施方案中,采用不依賴連接作用的克隆,將所述同源序列的兩種不同片段插入具有第二多核苷酸序列(最好是編碼正選擇標記的基因)的載體中,使得所述第二多核苷酸序列定位于所述構建體中的所述兩種不同的同源序列片段之間,構建所述打靶構建體。在該實施方案的一個方面,所述同源序列可以通過以下方法獲得產(chǎn)生與所述靶互補的兩種引物;使所述引物退火到小鼠基因組DNA文庫中含有所述靶區(qū)域的互補序列上;并且擴增與所述靶區(qū)域同源的序列。然后分離出具有由所述引物形成的終點的擴增反應產(chǎn)物。最好是通過PCR進行擴增,更優(yōu)選通過長距離PCR(long-range PCR)進行擴增。在另一實施方案中,所述載體還包含編碼篩選標記的基因。在再一實施方案中,所述載體也包括鄰接所述正選擇標記的重組酶位點。
本發(fā)明還提供在編碼TRP的基因中帶有破壞的脊椎動物,最好是小鼠。在一個實施方案中,本發(fā)明提供一種敲除小鼠,所述小鼠具有正常編碼并表達功能性TRP的基因的非功能性等位基因。本發(fā)明包括一種敲除小鼠,所述敲除小鼠具有兩個正常編碼并表達功能性TRP的基因的非功能性等位基因,因而不能產(chǎn)生野生型TRP。最好是,通過將包含本文所述任一種或者本領域可得到的編碼TRP的破壞的基因的干細胞,注射或者其它方法導入胚泡中,產(chǎn)生所述小鼠。然后將所得的胚泡注射到假孕小鼠體內,隨后讓其分娩出在其種系中帶有編碼所述TRP的受破壞基因的嵌合小鼠。本領域技術人員會認識到,可以繁育所述嵌合小鼠,以產(chǎn)生在編碼所述TRP的基因中帶有雜合破壞和帶有純合破壞的兩種小鼠。
按照一個實施方案,所述破壞改變了TRP基因啟動子、增強子或剪接位點中的至少一個,致使所述小鼠不表達功能性TRP蛋白。在另一實施方案中,所述破壞是插入突變、錯義突變、移碼突變或缺失突變。然后可以觀察這類敲除小鼠的表型。
本發(fā)明的一個方面是表型包括相對于普通正常野生型成年小鼠體重降低的敲除小鼠。通常,敲除小鼠的體重降低至少約15%。另一方面是表型包括相對于普通正常野生型成年小鼠身長降低的敲除小鼠。通常,身長至少降低約10%。本發(fā)明的再一方面是表型包括相對于正常野生型成年小鼠體重與身長之比降低的敲除小鼠。一般而言,觀察到至少約20%的降低。
在本發(fā)明的另一實施方案中,敲除小鼠的表型包括軟骨病。通常存在異常軟骨,并且軟骨生成減少。
本發(fā)明的另一方面是表型包括骨病的小鼠。通常,所述骨病包括骨異常和骨生成減少。在一個實施方案中,敲除小鼠表型的特征是軟骨發(fā)育不良。
在本發(fā)明的再一實施方案中,敲除小鼠的表型包括腎病。通常觀察到腎畸形。在一個實施方案中,敲除小鼠的表型包括腎發(fā)育不良。
本發(fā)明也提供能夠影響敲除小鼠表型的因子的鑒定方法。按照該方法,將推定的因子給予敲除小鼠。然后測定敲除小鼠對所述推定因子的反應,并將其與“正?!被蛞吧托∈蟮姆磻容^。本發(fā)明還提供按照這類方法鑒定的因子。
在本發(fā)明的又一個實施方案中,提供其中編碼TRP的靶DNA序列已被破壞的敲除細胞。按照一個實施方案,所述破壞抑制野生型TRP的產(chǎn)生??梢詮那贸杉毎?、組織或動物得到細胞或細胞系。在又一實施方案中,所述細胞是穩(wěn)定的細胞培養(yǎng)物。
本發(fā)明也提供包含編碼TRP的核酸序列的細胞系。這類細胞系可以借助于與在所述細胞系中有功能的啟動子有效連接,能夠表達這類序列。最好是,編碼所述TRP的序列的表達處于誘導型啟動子的控制之下。
本發(fā)明還提供新型的先前未鑒定過的編碼TRP的核酸序列。也提供鑒定與TRP相互作用的因子的方法,所述方法包括使所述TRP與一種因子接觸并且檢測因子/TRP復合物的步驟。
本發(fā)明也提供治療骨病的方法,所述方法包括將能夠影響敲除小鼠表型的因子給予合適的受治療者。合適的受治療者包括但不限于哺乳動物,包括人類。在一個實施方案中,所述骨病是軟骨發(fā)育不良。本發(fā)明也提供緩解骨病癥狀的方法,所述骨病癥狀例如骨縮短、生長板異常和椎骨變小。在可以給予的因子中有T243蛋白、其片段以及T243的天然和合成類似物。
也提供用于治療軟骨病的方法,所述方法包括將能夠影響敲除小鼠表型的因子給予受治療者。在一個實施方案中,所述軟骨病是軟骨發(fā)育不良。也提供緩解軟骨病癥狀的方法,所述軟骨病癥狀包括軟骨島大、不規(guī)則、軟骨細胞柱(chondrocyte column)短以及軟骨薄而不規(guī)則。
治療腎病的方法也包括在本發(fā)明范圍內。按照該方法,將有效量的因子例如T243蛋白、T243蛋白片段或T243的天然或合成類似物給予受治療者。在一個實施方案中,所述腎病是腎發(fā)育不良。本發(fā)明也包括緩解與腎病相關的癥狀的方法,所述癥狀例如小的異常生成的腎。
本發(fā)明也提供確定TRP中三核苷酸重復的擴增是否引起表型改變的方法。按照該方法,使其中正選擇標記側翼為重組酶位點的敲除干細胞與一種合成核酸接觸。所述合成核酸包括側翼為重組酶靶位點的三核苷酸重復。在識別所述重組酶靶位點的重組酶存在下,在所述合成核酸中的重組酶位點與鄰接所述正選擇標記的重組酶位點之間,通過酶輔助位點專一性發(fā)生重組,從而產(chǎn)生轉基因干細胞。然后可以將所產(chǎn)生的轉基因干細胞的表型與正常的野生型干細胞比較,以確定三核苷酸擴增是否產(chǎn)生表型改變。最好是,所述合成核酸包括至少約20個三核苷酸重復。所述酶輔助位點專一性可以例如是Cre重組酶-lox靶系統(tǒng)、或FLP重組酶-FRT靶系統(tǒng)。
本發(fā)明也提供編碼TRP的基因有三核苷酸擴增的脊椎動物、最好是小鼠。在一個實施方案中,所述小鼠的產(chǎn)生是通過將含有擴增型TRP基因的轉基因干細胞導入胚泡中來進行的。然后將所產(chǎn)生的胚泡植入假孕小鼠中,隨后讓其分娩出在其種系中含有所述擴增型三核苷酸重復基因的嵌合小鼠。然后可以繁育所述嵌合小鼠,以產(chǎn)生在編碼所述TRP的基因中帶有或者雜合或者純合破壞的小鼠。
本發(fā)明還提供新的擴增型TRP基因以及由這些基因編碼的蛋白質。也提供一種鑒定與擴增型TRP相互作用的因子的方法,所述方法包括以下步驟使所述擴增型TRP與一種因子接觸,并且測定因子/擴增型TRP復合物,從而鑒定與所述擴增型TRP相互作用的因子。
本發(fā)明也提供細胞系,所述細胞系包含編碼擴增型TRP的核酸序列,能夠通過與在所述細胞系中有功能的啟動子有效連接而表達這類序列。最好是,編碼所述擴增型TRP的序列的表達,處于誘導型啟動子的控制之下。
本文所用的“基因打靶”是當將基因組DNA的片段導入哺乳動物細胞中、所述片段定位并且與內源同源序列重組時發(fā)生的一種類型的同源重組。
在基因組DNA的片段定位并與內源同源序列重組,致使正常野生型基因產(chǎn)物的產(chǎn)生受到抑制時,發(fā)生靶基因的“破壞”。破壞的非限制性實例包括插入突變、錯義突變、移碼突變和缺失突變?;虼虬幸部梢愿淖儼谢虻膯幼?、增強子或剪接位點,而引起破壞,也可以包括啟動子被外源啟動子例如下述的誘導型啟動子取代。
本文所用的“敲除小鼠”是在其基因組中含有已經(jīng)用基因打靶方法破壞或失活的特定基因的小鼠。敲除小鼠既包括雜合子小鼠(即一個缺陷型等位基因和一個野生型等位基因),也包括純合突變體(即兩個缺陷型等位基因)。半合子小鼠也包括在本發(fā)明范圍內。人們會理解,在正常的野生型動物中,某些基因例如雄性中的性連鎖基因僅存在一個拷貝(即在正常野生型動物中是半合子)。正常為半合子的基因被破壞的敲除小鼠,將具有一個該基因的缺陷型等位基因。
術語“多核苷酸”和“核酸分子”可互換使用,是指任何長度的核苷酸的聚合形式。多核苷酸可以含有脫氧核糖核苷酸、核糖核苷酸和/或其類似物。核苷酸可以具有任何三維結構,可以執(zhí)行任何已知或未知的功能。術語“多核苷酸”包括單鏈分子、雙鏈分子和三股螺旋分子。
“寡核苷酸”是指具有5個和約100個核苷酸之間的單鏈或雙鏈DNA的多核苷酸。寡核苷酸也稱為寡聚物或oligo,可以從基因中分離出,或用本領域已知的方法化學合成?!耙铩笔侵竿ǔ閱捂湹墓押塑账幔鼮槊附閷У暮怂岷铣傻钠鹗继峁?’-羥基末端。
以下是多核苷酸的非限制性實施方案基因或基因片段、外顯子、內含子、mRNA、tRNA、rRNA、核酶、cDNA、重組多核苷酸、支鏈多核苷酸、質粒、載體、具任何序列的分離的DNA、具任何序列的分離的RNA、核酸探針和引物。核酸分子也可以包括經(jīng)修飾的核酸分子,例如甲基化核酸分子和核酸分子類似物。嘌呤和嘧啶的類似物是本領域已知的,包括但不限于氮丙啶基胞嘧啶、4-乙酰胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羧甲基氨基甲基-2-硫代尿嘧啶、5-羧甲基-氨基甲基尿嘧啶、肌苷、N6-異戊烯基腺嘌呤、1-甲基腺嘌呤、1-甲基假尿嘧啶、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、假尿嘧啶、5-戊炔基尿嘧啶和2,6-二氨基嘌呤。在脫氧核糖核酸中用尿嘧啶作為胸腺嘧啶的取代基,也被認為是嘧啶的類似物形式。
多核苷酸的“片段”是由編碼序列或非編碼序列的至少9個連續(xù)核苷酸組成的多核苷酸,所述至少9個連續(xù)核苷酸包括10個、11個、12個、13個或14個連續(xù)核苷酸,優(yōu)選至少15個連續(xù)核苷酸,更優(yōu)選至少45個核苷酸,也包括至少60個核苷酸。
本文使用的“堿基對”也稱為“bp”,是指互補的核酸分子。在DNA中有四種“類型”的堿基嘌呤堿基腺嘌呤(A)與嘧啶堿基胸腺嘧啶(T)形成氫鍵,而嘌呤堿基鳥嘌呤(G)與嘧啶堿基胞嘧啶(C)形成氫鍵。每個形成氫鍵的堿基對設置也被稱為Watson-Crick堿基對。一千個堿基對通常稱為一個千堿基對或kb?!皦A基對錯配”是指核酸分子中堿基不是互補的Watson-Crick堿基對的位置。短語“在任何位置都不包括至少一種類型的堿基”是指在任何位置都不具有四種堿基中的一種的核苷酸序列。例如,缺乏一種核苷酸(即缺乏一種類型的堿基)的序列可以由A、G、T堿基對組成,而不含C殘基。
本文所用的術語“構建體”是指待轉移到靶組織、細胞系或動物(包括人類)中的人工裝配的DNA區(qū)段。通常,所述構建體將包括特定的目的(interest)基因或序列、標記基因和合適的控制序列。術語“質?!笔侵缸灾髯晕覐椭菩腿旧w外DNA分子。在一個優(yōu)選實施方案中,本發(fā)明的質粒構建體含有一個位于目的基因兩個側翼區(qū)之間的正選擇標記??扇芜x的是,所述構建體也可以含有一種篩選標記,例如綠色熒光蛋白(GFP)。如果存在的話,所述篩選標記位于所述側翼區(qū)之外并與之距一定距離。
術語“聚合酶鏈式反應”或“PCR”是指用熱穩(wěn)定聚合酶(例如Taq聚合酶)和兩種寡核苷酸引物擴增DNA堿基序列的方法;其中一種引物與待擴增序列一個末端的(+)鏈互補,而另一種引物與另一末端的(-)鏈互補。因為新合成的DNA鏈隨后可以用作相同引物序列的額外模板,所以連續(xù)多輪的引物退火、鏈延伸和解離,導致所需序列以指數(shù)高度特異性地擴增。PCR也可以用來檢測DNA樣品中特定序列的存在?!伴L距離”是指允許擴增大的核苷酸序列段(例如大于1kb)的PCR條件。
本文所用的術語“正選擇標記”是指這樣一種基因,所述基因編碼一種致使在某些條件下僅攜帶該基因的細胞存活和/生長的產(chǎn)物。例如,表達所導入的新霉素抗性(Neor)基因的植物和動物細胞對化合物G418具有抗性。不帶有Neor基因標記的細胞被G418殺死。其它正選擇標記是本領域技術人員已知的。
“正-負選擇”是指選擇攜帶在特定打靶位置整合的DNA插入片段的細胞(正選擇)以及選擇除去攜帶在染色體的非打靶位點整合的DNA插入片段的細胞(負選擇)的過程。負選擇插入片段的非限制性實例包括編碼胸苷激酶(tk)的基因。適合于正-負選擇的基因是本領域已知的,參見例如美國專利5,464,764。
“篩選標記”或“報道基因”是指所編碼的產(chǎn)物可容易地分析的基因。例如,報道基因可以用來確定特定DNA構建體是否已經(jīng)成功地導入細胞、器官或組織中。篩選標記的非限制性實例包括編碼綠色熒光蛋白(GFP)的基因或者編碼經(jīng)修飾的熒光蛋白的基因?!柏摵Y選標記”不應被解釋為負選擇標記;負選擇標記通常殺死表達該標記的細胞。
術語“載體”是指可以攜帶所插入DNA并且可以在宿主細胞中保持的DNA分子。載體也被稱為克隆載體(cloning vector)、克隆載體(cloning vehicle)或載體(vehicle)。該術語包括主要用來將核酸分子插入細胞的載體、主要用來復制核酸的復制型載體以及用來轉錄和/或翻譯所述DNA或RNA的表達載體。也包括提供不止一種上述功能的載體。在一個優(yōu)選實施方案中,所述載體含有可用于本文所述方法的位點,例如本文描述的載體“pDG2”或“pDG4”。
“宿主細胞”包括可以成為或已經(jīng)是載體受體或摻入核酸分子和/或蛋白的受體的單個細胞或細胞培養(yǎng)物。宿主細胞包括單個宿主細胞的子代,所述子代由于天然突變、意外突變或有意的突變,可能不一定與原始親代完全相同(在形態(tài)學方面或總DNA互補序列方面)。宿主細胞包括用本發(fā)明的構建體轉染的細胞。
術語“基因組文庫”是指由一組代表一種生物的基因組、隨機產(chǎn)生的重疊DNA片段所構成的克隆的集合體?!癱DNA文庫”(互補DNA文庫)是將細胞、組織或生物中存在的mRNA分子用反轉錄酶轉變?yōu)閏DNA分子、然后插入載體(在加入外源DNA后可以繼續(xù)復制的其它DNA分子)中得到的集合體。供文庫用的示范性載體包括噬菌體(bacteriophage)(也稱為“噬菌體(phage))”,它們是感染細菌的病毒,例如λ噬菌體。然后在所述文庫中探測所述特定的目的cDNA(以及從而探測mRNA)。在一個實施方案中,將噬菌體載體系統(tǒng)的高效率與質粒系統(tǒng)的便利性相結合的文庫系統(tǒng)(例如ZAP系統(tǒng),得自Stratagene,La,Jolla,CA)用于實施本發(fā)明。
術語“同源重組”是指兩種DNA分子或染色質之間在具同源核苷酸序列(即優(yōu)選具有約70%序列同一性、通常至少約85%同一性、優(yōu)選至少約90%同一性、或者至少約95-98%同一性的那些序列)的位點進行DNA片段的交換。用“BLASTN”算法,例如在http//www.ncbi.nlm.nih.gov80/BLAST/(Basic,Advanced或PSI)可在線得到、并且在以下任一文獻中描述的BLAST(基本局部比對搜索工具(Basic Local Alignment Search Tool))2.0,可以測定同源性和/或同一性百分比,所述文獻是ALtschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.和Lipman,D.J.(1990)“基本局部比對搜索工具”J.Mol.Biol.215403-410.(Medline);Gish,W.和States,D.J.(1993)“通過數(shù)據(jù)庫相似性搜索鑒定蛋白質編碼區(qū)”Nature Genet.3266-272.(Medline);Madden,T.L.,Tatusov,R.L.和Zhang,J.(1996)“網(wǎng)絡BLAST服務器的應用”Meth.Enzymol.266131-141.(Medline);Altschul,S.F.,Madden,T.L.,Schffer,A.A.,Zhang,J.,Zhang,Z.,Miller,W.和Lipman,D.J.(1997)“包括空位的BLAST和PSI-BLAST新一代蛋白質數(shù)據(jù)庫搜索程序”Nucleic AcidsRes.253389-3402.(Medline);以及Zhang,J.和Madden,T.L.(1997)“PowerBLAST交互或自動序列分析和注釋的一個新的網(wǎng)絡BLAST應用”Genome Res.7649-656.(Medline)。不言而喻,同源序列可以在所述核苷酸序列中包括插入、缺失和取代。因此,即使某些核苷酸殘基不完全對應或比對,核苷酸的線性序列也可以是基本上相同的。
本文所用的術語“不依賴連接作用的克隆”以常規(guī)含義使用,是指無需激酶或連接酶而將DNA分子摻入到載體或染色體中。例如在Aslanidis和de Jong,Nucleic Acids Res.,186069-74和順序號為07/847,298(1991)的美國專利申請中,描述了不依賴連接作用的克隆技術。
本文所用的術語“靶序列”(或者稱為“靶基因序列”或“靶DNA序列”)是指具有在整個群體中其序列與任何疾病或可分辨表型都不相關的任何多核苷酸的核酸分子。注意到,在整個群體中,野生型基因可能包括多種優(yōu)勢形式,所述優(yōu)勢形式相互之間在序列中含有改變,尚不引起可分辨的病理學效應。這些變異被稱為“多態(tài)性”或“等位基因變異”。
在一個優(yōu)選實施方案中,所述靶DNA序列包含所述個體基因組DNA中特定基因或基因座的一部分。最好是,所述靶DNA序列編碼一種TRP,最好是具有編碼亮氨酸的CTG的三核苷酸重復。按照一個實施方案,所述靶DNA包含基因產(chǎn)物功能未知的特定基因或基因座的一部分,所述基因例如為用部分cDNA序列(例如EST)鑒定的基因。在一個優(yōu)選實施方案中,所述靶TRP基因是T243。最好是,所述靶DNA序列包含SEQ ID NO47(鼠類)或SEQ ID NO57(人類)或其天然存在的等位基因變異體。
術語“外切核酸酶”是指從線性核酸底物的游離末端順序切割核苷酸的酶。外切核酸酶對雙鏈或單鏈核苷酸是專一性的和/或定向的,例如3’-5’和/或5’-3’。某些外切核酸酶顯示出其它酶活性,例如T4DNA聚合酶既是聚合酶,又是活性3’-5’外切核酸酶。其它示范性外切核酸酶包括外切核酸酶III,該酶從不具有磷酸化3’末端的雙鏈DNA的5’末端一次除去一個核苷酸;外切核酸酶VI,該酶通過切去單鏈DNA兩端的核苷酸而制備寡核苷酸;以及外切核酸酶λ,該酶從連接有5’-磷酸基團的雙鏈DNA的5’末端切除核苷酸。
術語“重組酶”包括誘導、介導或促進重組的酶;引起、介導或促進核酸序列重排或在第二核酸序列切除或插入第一核酸序列的其它核酸修飾酶。重組酶的“靶位點”是所述重組酶所識別(例如與其特異性地結合)和/或作用(切除、切割或誘導重組)的核酸序列或區(qū)域。本文所用的表述“酶指導的位點專一性重組”將包括以下三種事件
1.缺失重組酶靶位點所鄰接的預選定的DNA區(qū)段;2.將重組酶靶位點所鄰接的預選定DNA區(qū)段的核苷酸序列倒位;3.將位于不同DNA分子上鄰近重組酶靶位點的DNA區(qū)段相互交換。
附圖簡述
圖1是一幅簡圖,描述一種構建本發(fā)明打靶載體的方法。該質粒PCR法在實施例9和實施例10中有描述。
圖2A是一幅簡圖,描述pDG2載體。該載體含有一個氨芐青霉素抗性基因和一個新霉素(Neor)基因。在Neor基因的兩側有兩個供不依賴連接作用的克隆用的位點以及限制性酶切位點。pDG2的序列示于圖2B和SEQ ID NO1中。
圖3A是一幅簡圖,描述pDG4載體。該載體含有一個氨芐青霉素抗性基因、一個新霉素(Neor)基因和一個綠色熒光蛋白(GFP)基因。在Neor基因的兩側有兩個供不依賴連接作用的克隆用的位點以及限制性酶識別位點。pDG4的序列示于圖3B和SEQ ID NO2中。
圖4(SEQ ID NO3-SEQ ID NO10)顯示了經(jīng)PCR擴增的基因組DNA末端所含有的退火位點1-4在用T4 DNA聚合酶處理之前和之后的核酸序列。
圖5(SEQ ID NO11-SEQ ID NO18)顯示了pDG2載體中所含有的退火位點1-4在用T4 DNA聚合酶處理之前和之后的核酸序列。
圖6顯示了在退火反應期間5’和3’側翼DNA相對于pDG2載體內的退火位點1、2、3和4的重排。
圖7顯示了在退火反應期間5’和3’側翼DNA相對于pDG4載體內的退火位點1、2、3和4以及GFP篩選標記的重排。
圖8顯示了用于實施例4-10中的寡核苷酸引物的序列(SEQ IDNO19-SEQ ID NO44)。小寫序列是克隆位點(例如不依賴連接作用的克隆序列)。
圖9顯示了兩只雜合T243敲除小鼠之間交配編號1799的子代的身長、體重和體重/身長之比。
圖10顯示了兩只雜合T243敲除小鼠之間交配編號1808的子代的身長、體重和體重/身長之比。
圖11顯示了編碼鼠類TRP(SEQ ID NO52)(具體地說,是T243的表達產(chǎn)物)的核酸序列(SEQ ID NO47);和編碼人類TRP(SEQ IDNO58)的核酸序列(SEQ ID NO57)。
圖12顯示了鼠類TRP的氨基酸序列(SEQ ID NO52)和人類TRP的氨基酸序列(SEQ ID NO58)。
圖13顯示了用于PCR擴增與靶基因T243同源的序列的寡核苷酸引物的核酸序列(SEQ ID NO45;SEQ ID NO46)。還顯示了具有克隆位點的所述引物(SEQ ID NO48;SEQ ID NO49)和用于鑒定靶基因T243中含有的文庫部分的引物的核酸序列(SEQ ID NO55;SEQ IDNO56)。
圖14顯示了通過PCR擴增產(chǎn)生的、與靶基因T243同源的序列的核酸序列(SEQ ID NO50;SEQ ID NO51)。
圖15顯示了用包含同源序列(SEQ ID NO50;SEQ ID NO51)的構建體產(chǎn)生的靶基因T243的缺失型基因片段的核酸序列(SEQ IDNO59)。還顯示了擴增型T243基因的核酸序列(SEQ ID NO53)以及相應表達產(chǎn)物的氨基酸序列(SEQ ID NO54)。
發(fā)明詳述本發(fā)明部分基于對于基因的表達和作用以及基因表達產(chǎn)物、主要是與三核苷酸重復蛋白相關的那些基因產(chǎn)物的評估。尤其是,這使得可以確定疾病途徑(disease pathway)和鑒定該途徑中在診斷和治療方面有用的靶。例如,在病癥狀況下突變的或被負調節(jié)的基因,可能參與引起該病癥或使其惡化。目標在于正調節(jié)這類基因活性的治療或涉及替代途徑的治療,可能緩解所述病癥。
本文所用的“基因”是指(a)含有本文所公開的DNA序列中至少一種的基因;(b)編碼由本文公開的DNA序列所編碼的氨基酸序列的任何DNA序列;和/或(c)與本文公開的編碼序列的互補序列雜交的任何DNA序列。最好是,該術語包括編碼區(qū)和非編碼區(qū),最好包括正?;虮磉_所必需的所有序列,包括啟動子、增強子和其它調節(jié)序列。
本發(fā)明也包括與前一段落中的DNA序列(a)-(c)雜交、并因此是所述DNA序列(a)-(c)的互補序列的核酸分子,最好是DNA分子。這種體外雜交條件可以是高度嚴格性的,或嚴格性不太高。高度嚴格性條件例如包括在0.5M NaHPO4、7%十二烷基硫酸鈉(SDS)、1mM EDTA中于65℃與結合于濾膜的DNA雜交,并且在0.1×SSC/0.1%SDS于68℃洗滌(參見Ausubel F.M.等編著,1989,Current Protocols inMolecular Biology,第I卷,Green Publishing Associates,Inc.,和JohnWiley & Sons,Inc.,New York,第2.10.3頁;Sambrook,F(xiàn)ritsch和Maniatis,Molecular CloningA Laboratory Manual,第二版,第2卷,Cold Springs Harbor Laboratory,Cold Springs,N.Y.,第8.46-8.47頁(1995),這兩個參考文獻均通過引用結合到本文中),而嚴格性不太高的條件諸如中等嚴格性條件,例如在0.2×SSC/0.1%SDS中于42℃洗滌(Ausubel等,1989,參見上文;Sambrook等,1989,參見上文)。
在核酸分子是脫氧寡核苷酸(“oligo”)的情況下,高度嚴格性條件可以是指例如在6×SSC/0.05%焦磷酸鈉中于37℃(對于14個堿基的oligo)、48℃(對于17個堿基的oligo)、55℃(對于20個堿基的oligo)和60℃(對于23個堿基的oligos)洗滌。這些核酸分子在體內可以用作在例如靶基因的調節(jié)有用的靶基因反義分子和/或用作靶基因核酸序列擴增反應中的反義引物。此外,這類序列可以用作核酶序列和/或三股螺旋序列的一部分,也可用于靶基因的調節(jié)。再者,這類分子可以用作診斷方法中的組分,從而可以檢測致病等位基因的存在。
本發(fā)明也包括(a)含有任一前述編碼序列和/或其互補序列(即反義序列)中的DNA載體;(b)含有與指導任一前述編碼序列表達的調節(jié)元件有效連接的所述編碼序列的DNA表達載體;和(c)含有與指導任一前述編碼序列在宿主細胞中表達的調節(jié)元件有效連接的所述編碼序列的基因工程宿主細胞。本文所用的調節(jié)元件包括但不限于誘導型和非誘導型啟動子、增強子、操縱基因和本領域技術人員已知的驅動和調節(jié)表達的其它元件。本發(fā)明包括任一本文公開的DNA序列的片段。
除上述基因序列外,采用本領域眾所周知的分子生物學技術,無需過度實驗,就可以鑒定這類序列的同源物,例如可能存在于其它物種的同源物,并且可以容易地將其分離出。此外,在基因組中的其它基因座可能存在編碼與這類基因產(chǎn)物的一個或多個結構域具有廣泛同源性的蛋白質的基因。這些基因也可以用相似的技術來鑒定。
例如,可以對經(jīng)分離的差異表達的基因序列或其部分進行標記,并用來篩選由得自目的生物的mRNA構建的cDNA文庫。當從與所述標記序列所來源的生物類型不同的生物中得到cDNA文庫時,雜交條件的嚴格性要低些。另一方面,采用適宜的嚴格性條件,又可以用標記片段來篩選由目的生物制備的基因組文庫。這種低嚴格性條件是本領域技術人員眾所周知的,可以預測,根據(jù)所述文庫和標記序列所來源的具體生物,這種低嚴格性條件會有所改變。有關這類條件的指南,參見例如Sambrook等,1989,Ausubel等,1989。
在所鑒定的基因是正常的或野生型基因的情況下,該基因可以用來分離所述基因的突變型等位基因。就已知有或懷疑有遺傳基礎的過程和疾病而論,這樣一種分離是優(yōu)選的??梢詮幕蛘咭阎谢驊岩捎袑е虏“Y的基因型的個體,分離出突變型等位基因。然后可以將突變型等位基因和突變型等位基因產(chǎn)物用于治療和診斷分析系統(tǒng)中。
可以例如采用本領域技術人員眾所周知的技術-PCR,分離突變型基因的cDNA。在這種情況下,通過使寡聚dT寡核苷酸與從組織中分離的并且已知或懷疑在推定攜帶所述突變型等位基因的個體中表達的mRNA雜交,并且通過用反轉錄酶延伸所述新鏈,可以合成第一條cDNA鏈。然后,用與正?;?’端特異性雜交的寡核苷酸,合成所述cDNA的第二條鏈。然后用這兩種引物通過PCR擴增所述產(chǎn)物,將所述產(chǎn)物克隆到合適的載體中,用本領域技術人員熟知的方法進行DNA序列分析。通過比較突變型基因和正常基因的DNA序列,可以確定導致所述突變型基因產(chǎn)物功能喪失或改變的突變。
或者,可以構建基因組文庫或cDNA文庫,并且分別用從已知或懷疑在懷疑或已知攜帶所述突變型等位基因的個體中表達目的基因的組織中得到的DNA或RNA進行篩選。然后可以標記所述正常基因或其任何合適的片段,將其用作探針,鑒定所述文庫中相應的突變型等位基因??梢酝ㄟ^本領域中常規(guī)使用的方法,純化含有該基因的克隆,并且對其進行序列分析。
任何本領域已知的技術都可以用來將靶基因轉基因導入動物中,以產(chǎn)生轉基因動物的建立者系。這類技術包括但不限于原核微注射(美國專利第4,873,191號);反轉錄病毒介導的基因轉移到種系中(Van der Putten等,Proc.Natl.Acad.Sci.,USA,826148-6152(1985));胚胎干細胞中的基因打靶(Thompson等,Cell,56313-321(1989));胚胎電穿孔(Lo,Mol Cell.Biol.,31803-1814(1983));和精子介導的基因轉移(Lavitrano等,Cell,57717-723(1989))等。有關這類技術的綜述,參見Gordon,Transgenic Animals,Intl.Rev.Cytol.,115171-229(1989),該文獻通過引用全部結合到本文中。
在一個優(yōu)選實施方案中,采用同源重組來產(chǎn)生本發(fā)明的敲除小鼠。最好是,以兩步產(chǎn)生所述構建體,即(1)擴增(例如使用長距離PCR)與靶序列同源的序列,和(2)將另一種多核苷酸(例如一種選擇標記)插入所述PCR產(chǎn)物中,使得其側翼為所述同源序列。通常,所述載體是來自質?;蚪M文庫的質粒。構建好的構建體也常常是環(huán)狀質粒。因此,如圖1所示,采用長距離PCR和“向外(outwardly pointing)”寡核苷酸,產(chǎn)生其中可以容易插入選擇標記、最好是通過不依賴連接作用的克隆插入選擇標記的載體。然后將所述構建體導入ES細胞,在此它可以破壞所述同源靶序列的功能。
同源重組也可以用來敲除干細胞和不是全能胚胎干細胞的其它細胞類型中的基因。作為實例,干細胞可以是骨髓細胞、淋巴樣細胞或神經(jīng)祖細胞或前體細胞。這類敲除細胞可能在研究個體發(fā)育途徑中靶基因的功能方面特別有用。干細胞可以來源于任何脊椎動物,例如小鼠、大鼠、狗、貓、豬、兔、人類、非人類靈長類等。
在非全能的細胞中,可能最好是用本領域已知的方法敲除所述靶的兩個拷貝。例如,對包含靶基因座的同源重組的細胞,根據(jù)正選擇標記(例如Neor)的表達進行選擇,并且根據(jù)非隨機整合進行篩選,經(jīng)過選擇和篩選的所述細胞可以通過暴露于提高水平的選擇劑(例如G418),進一步選擇具有多拷貝所述選擇標記的細胞。然后,分析所述細胞在靶基因座的純合性。或者,可以在所述兩個同源序列之間插入一個不同的正選擇標記,產(chǎn)生第二構建體??梢詫⑦@兩種構建體或者順序導入細胞,或者同時導入細胞,然后根據(jù)每種正選擇標記基因進行合適的選擇。根據(jù)所述靶的兩種等位基因的同源重組,對最終的細胞進行篩選。
另一方面,擴增目的克隆的兩個分開的片段,采用不依賴連接作用的克隆技術將它們插入到含有正選擇標記的載體中。在該實施方案中,目的克隆一般來自噬菌體文庫,并且用PCR技術鑒定和分離??梢杂脙蓚€步驟或用一個步驟進行不依賴連接作用的克隆。
按照一個優(yōu)選方法,使用具有多個可以產(chǎn)生5’-3’單鏈區(qū)的位點的構建體。這些構建體,最好是質粒,包括能夠進行定向的四向(four-way)不依賴連接作用的克隆的載體。
所述構建體通常包含一個編碼正選擇標記的序列(例如編碼新霉素抗性的基因);在所述正選擇標記任一側的一個限制性酶切位點;和鄰接所述限制性酶切位點、不含4個堿基對之一的序列。這種構型使得可以通過用合適的限制性酶消化所述構建體,并且用具有外切核酸酶活性的化合物(例如T4 DNA聚合酶)處理所述片段,在所述序列中產(chǎn)生單鏈末端。
在一個優(yōu)選實施方案中,適用于將定向突變導入ES細胞的構建體最好直接由質?;蚪M文庫制備。采用長距離PCR與特異性引物,以一個步驟從所述質粒文庫中鑒定并分離出目的序列。在分離該序列之后,可以容易地把要破壞所述靶序列的第二多核苷酸插入編碼所述目的序列的兩個區(qū)之間。采用這種直接方法,可以在少至72小時內構建定向構建體。在另一實施方案中,如下所述,在噬菌體基因組文庫中鑒定目的克隆之后,制備定向構建體。
本文所述的方法消除了雜交分離、限制性作圖和多克隆步驟的需要。而且,采用這些方法可以測定任何基因的功能。例如,可以用短序列(例如EST)來設計寡核苷酸探針。這些探針可以用于直接擴增程序中,以構建構建體;或者可以用來篩選基因組文庫或cDNA文庫中較長的全長基因。因此,考慮了,可以快速有效地制備任何基因,以供用于ES細胞。
在一個優(yōu)選實施方案中,直接從質?;蚪M文庫制備構建體。可以采用本領域已知的任何方法制備所述文庫。最好是,從小鼠ES細胞分離DNA,用限制性內切核酸酶處理,將所述DNA切割為片段。然后將所述DNA片段插入載體中,例如插入噬菌體或噬菌粒(例如λZAPTM,Stratagene,La Jolla,CA)系統(tǒng)中。當在ZAPTM系統(tǒng)中構建該文庫時,所述DNA片段最好在約5千堿基和約20千堿基之間。
最好是,用于制備文庫的生物沒有可分辨的疾病或表型效應。所述文庫最好是小鼠文庫。該DNA可以從任何細胞來源或體液獲得??捎糜谂R床實踐的細胞來源的非限制性實例包括ES細胞、肝細胞、腎細胞、血細胞、口頰細胞(buccal cells)、宮頸陰道細胞、得自尿的上皮細胞、胎兒細胞或在通過活組織檢查獲得的組織中存在的任何細胞。體液包括尿、血液、腦脊液(CSF)和感染或炎癥部位的組織滲出液。用本領域已知的任何方法,從所述細胞或體液提取DNA。最好是,通過將5ml裂解緩沖液(10mM Tris-HCl pH7.5、10mM EDTA(pH8.0)、10mMNaCl、0.5%SDS和1mg/ml蛋白酶K)加入含有匯合的胚胎干細胞的100mm平板中,提取所述DNA。然后將細胞于約60℃孵育數(shù)小時或直至完全裂解。通過數(shù)輪溫和的苯酚氯仿抽提、然后乙醇沉淀,從裂解的細胞中純化基因組DNA。為了方便起見,將基因組文庫布置成多個庫。
在一個優(yōu)選實施方案中,用寡核苷酸引物和長距離PCR,從所述質粒文庫中鑒定目的序列。通常,引物是根據(jù)從部分基因序列獲得的序列信息(例如cDNA或EST序列)設計的向外引物。例如圖1中所示,所述產(chǎn)物將是不包括位于每種引物之間的區(qū)域的線性片段。
被認為合適的PCR條件在以下實施例中描述。人們會理解,本領域技術人員可以容易地確定最適PCR條件。(參見例如PCR 2APractical Approach(1995)M.J.McPherson,B.D.Hames和G.R.Taylor編著,IRL Press,Oxford;Yu等,Methods Mol.Bio.,58335-9(1996);Munroe等,Proc.Nat’l.Acad.Sci.,USA,922209-13(1995))。對文庫進行PCR篩選,消除了與常規(guī)雜交篩選相關的許多問題和時間的延遲,在所述常規(guī)雜交中,必須將文庫鋪平板、制備濾膜、制備放射性探針和建立雜交條件。PCR篩選僅需要目的序列(基因)的寡核苷酸引物??梢圆捎脦追N方法,包括但不限于微量過濾、透析、凝膠電泳等,來純化PCR產(chǎn)物??赡茏詈檬浅ビ糜赑CR中的聚合酶,使得不能夠發(fā)生新的DNA合成。合適的熱穩(wěn)定DNA聚合酶是可在市場上獲得,例如VentTMDNA聚合酶(New England Biolabs)、Deep VentTMDNA聚合酶(New England Biolabs)、HotTubTMDNA聚合酶(Amersham)、ThermoSequenaseTM(Amersham)、rBstTMDNA聚合酶(Epicenter)、PfuTMDNA聚合酶(Stratagene)、Amplitaq GoldTM(Perkin Elmer)和ExpandTM(Boehringer Mannheim)。
為了產(chǎn)生構建好的構建體,把會破壞所述靶序列的序列插入所述PCR擴增的產(chǎn)物中。例如,如本文所述,直接方法包括將長距離PCR產(chǎn)物(即載體)和一種片段(即編碼選擇標記的基因)連接在一起。如上所論述,所述載體含有與所述靶DNA序列同源的兩個不同的序列區(qū)。最好是,所述載體也含有編碼選擇標記(例如氨芐青霉素)的序列。所述載體和片段的設計使得當對其進行處理而形成單鏈末端時,它們將退火,使得所述片段定位于與所述靶基因基本同源的兩個不同區(qū)之間。
雖然任何克隆方法都是適用的,但最好是用不依賴連接作用的克隆策略,來裝配包含鄰接選擇標記的兩個不同同源區(qū)的構建體。不依賴連接作用的克隆(LIC)是一種無需使用激酶或連接酶而定向克隆多核苷酸的策略。(參見例如Aslanidis等,Nucleic Acids Res.,186069-74(1990);Rashtchian,Current Opin.Biotech.,630-36(1995))。通常通過用T4 DNA聚合酶在僅存在一種dNTP的情況下處理所述載體(在經(jīng)消化的限制性酶切位點),在LIC載體中產(chǎn)生單鏈尾(也稱為克隆位點或退火序列)。T4 DNA聚合酶的3’-5’外切核酸酶活性除去核苷酸,直至它遇到對應于反應混合物中存在的所述單一dNTP的殘基。這時,該酶的5’-3’聚合酶活性抵消了外切核酸酶活性,阻止進一步切割。所述載體的設計,使得所產(chǎn)生的單鏈尾是非互補的。例如,在pDG2載體中,所述4個退火位點的單鏈尾相互之間都不互補。通過使5’適當?shù)匮由斓焦押塑账嵋镏?,產(chǎn)生PCR產(chǎn)物。純化PCR產(chǎn)物,以除去dNTP(如果將原始質粒用作模板,也除去原始質粒),然后用在存在合適的dNTP的情況下用T4 DNA聚合酶處理,產(chǎn)生特異性的載體匹配的突出端。通過使匹配的尾退火而發(fā)生克隆。例如用化學法或酶法,在所述克隆片段末端產(chǎn)生單鏈尾。在所述載體上產(chǎn)生互補尾;然而為了防止無插入片段的載體退火,所述載體尾相互之間不互補。尾的長度至少約5個核苷酸,優(yōu)選至少約12個核苷酸,甚至更優(yōu)選至少約20個核苷酸。
在一個實施方案中,將重疊的載體和片段置于同一反應中,足以使其退火。或者,將互補序列混合,加熱并讓其緩慢冷卻。加熱步驟優(yōu)選在約60℃和約100℃之間進行,更優(yōu)選在約60℃和80℃之間進行,甚至更優(yōu)選在60℃和70℃之間進行。然后,讓加熱反應物冷卻。一般而言,冷卻的發(fā)生相當緩慢,例如,在約室溫,所述反應一般在約1小時后發(fā)生。冷卻必須足夠緩慢,以便讓其退火。退火的片段/載體可以直接使用,或于-20℃凍存待用。
此外,通過調節(jié)鹽和溫度而達到合適的條件,可以進行退火。在范圍在約10mM NaCl至約600mM NaCl的溶液中,于范圍為約37℃至約65℃的溫度下,進行雜交反應。人們會理解,雜交反應的嚴格性由鹽濃度和溫度兩者決定。例如,在10mM鹽中37℃進行雜交,其嚴格性與在500mM鹽中65℃的嚴格性相似。對于本發(fā)明,可以使用在同源互補序列之間形成雜交體的任何雜交條件。
如圖1所示,在一個實施方案中,在應用這些退火方法中的任一種后制備構建體,其中所述載體部分含有與靶基因(用長距離PCR從質粒文庫中擴增的)基本同源的兩個不同區(qū),而所述片段是編碼選擇標記的基因。
在退火后,用本領域已知的方法,將所述構建體轉化到感受態(tài)大腸桿菌細胞(例如DH5-α細胞)中,擴增所述構建體。分離的構建體隨時可用于導入ES細胞。
在另一實施方案中,在匯集的基因組文庫中,用PCR鑒定目的克隆。在一個實施方案中,所述PCR條件使得編碼選擇標記的基因可以直接插入到鑒定為陽性的克隆中。所述標記定位于與靶DNA具有基本同源性的兩個不同序列之間。
可以采用本領域已知的和實施例中描述的任何方法,制備基因組噬菌體文庫。最好是,通過將基因組DNA切割成長度約20千堿基的片段,用λ噬菌體制備小鼠胚胎干細胞文庫。然后,將所述片段插入到任何合適的λ克隆載體例如λFix II或λDash II(Stratagene,La Jolla,Ca)中。
為了從文庫中快速而有效地篩選大量克隆,可以構建具有多個平板接種文庫的庫。在一個優(yōu)選實施方案中,一個基因組λ噬菌體文庫以每個平板約1,000克隆(噬斑)的密度鋪平板。產(chǎn)生足夠的平板,以在數(shù)次鋪平板后可代表所述生物的整個基因組。例如,約1×106克隆(1000個平板)將產(chǎn)生約8個基因組相當物。然后,例如通過用緩沖液覆蓋所述平板,將平板保溫,再收集緩沖液,來收集噬斑。緩沖液的用量將根據(jù)平板大小而變,一般而言,一個100mm直徑的平板應用約4ml緩沖液覆蓋,然后收集約2ml。
人們會認識到,可以在該程序期間的任何時候將單個平板的裂解液合并,可以將它們以任何組合合并。然而,為了隨后易于鑒定單個克隆,最好是分開保持每個平板的裂解液,然后制備一個庫。例如,可以將每個2ml的裂解液置于96孔深孔平板中。然后通過從每個孔中取一定量,例如約100μl,并將其在一個新平板的孔中混合,形成一個庫。最好是,在一個孔中混合12個100μl的單個平板裂解液,形成一個代表12,000個該文庫克隆的1.2ml的庫。
然后,用已知擴增所述靶基因的一組PCR引物,對每個庫進行PCR擴增。靶基因可以是已知的全長基因,或更優(yōu)選是從公眾可得的核酸序列數(shù)據(jù)庫(例如GenBank或EMBL)獲得的部分cDNA序列。這些數(shù)據(jù)庫包括稱為已表達序列標志(EST)的部分cDNA序列??梢圆捎帽绢I域已知的任何方法,從任何生物中分離出寡核苷酸PCR引物,或者最好用化學法合成寡核苷酸PCR引物。
一旦在基因組文庫中鑒定出靶基因的陽性克隆,則必須產(chǎn)生編碼所述靶基因不同部分的兩種片段。換句話說,產(chǎn)生所述靶的小的已知區(qū)(例如EST)的側翼區(qū)。雖然,每個側翼區(qū)的大小并不是關鍵性的,但其范圍可以是從小至100個堿基對至多達100kb,最好是每種側翼片段的長度大于約1kb,更優(yōu)選在約1kb和約10kb之間,甚至更優(yōu)選在約1kb和約5kb之間。本領域技術人員會認識到,雖然較大的片段可以增加ES細胞中同源重組事件的次數(shù),但較大的片段也將更加難以克隆。
在一個實施方案中,用來擴增側翼片段的寡核苷酸PCR引物之一對于文庫克隆載體(例如λ噬菌體)是特異性的。因此,如果該文庫是λ噬菌體文庫,那么對λ噬菌體臂特異性的引物可以與對所述陽性克隆特異性的引物結合使用,以產(chǎn)生長的側翼片段??梢栽O置多重PCR反應,以測試不同的引物組合。最好是,所用引物將產(chǎn)生長度約2kb和約6kb之間的側翼序列。
最好是,根據(jù)與所述片段待克隆進的載體互補的5’序列,設計所述寡核苷酸引物。另外,所述引物的設計,也使得當裝配所述構建體時,所述側翼片段將相對于所述載體以及相互之間以適宜的3’-5’定向。當靶基因是T243時,在一個實施方案中,所述引物之一包含SEQID NO48,而在另一個實施方案中,另一引物包含SEQ ID NO49。
因此,采用基于PCR的方法,例如,可以根據(jù)在電泳凝膠上顯現(xiàn)出一條帶,鑒定出陽性克隆。
一方面,所述克隆涉及一種載體和兩種片段。所述載體含有正選擇標記(最好是Neor)和位于所述正選擇標記兩側的用于所述靶基因的兩種不同區(qū)的克隆位點??扇芜x的是,所述載體也含有編碼篩選標記的序列(報道基因),所述序列最好是與所述正選擇標記的定位相反。所述篩選標記將位于同源序列的側翼區(qū)之外。圖3A顯示了所述載體的一個實施方案,篩選標記GFP位于所述載體的一側。然而,所述篩選標記可以位于與正選擇標記Neor相反一側的Not I和位點4之間的任何位置。
合適載體的一個實例是圖2所示的具有SEQ ID NO1序列的質粒載體。本文也顯示了圖1標記為“位點1、2、3或4”的特異性核酸不依賴連接作用的克隆位點(也稱為退火位點)。一般而言,所述克隆位點缺乏至少一種類型的堿基,例如胸腺嘧啶(T)、鳥嘌呤(G)、胞嘧啶(C)或腺嘌呤(A)。因此,使所述載體與既作為聚合酶又作為外切核酸酶的酶在僅存在所述一種缺少的核苷酸的情況下進行反應,將產(chǎn)生突出端。例如,T4 DNA聚合酶既作為3’-5’外切核酸酶起作用,又作為聚合酶起作用。因此,當聚合酶活性可利用的核苷酸不足時,T4將作為外切核酸酶起作用。因此,通過使pDG2載體與T4 DNA聚合酶在僅存在dTTP的情況下反應,可以產(chǎn)生特異性突出端??捎糜趯嵤┍景l(fā)明的其它酶是本領域已知的,例如尿嘧啶DNA糖基化酶(UDG)(參見例如WO 93/18175)。本文例舉的載體具有24個核苷酸的突出端。本領域技術人員會知道,成功的不依賴連接作用的克隆需要少至5個核苷酸。
在另一實施方案中,用兩步克隆方案裝配構建體。第一步,將每個同源性的克隆區(qū)分別克隆到所述載體的兩個退火位點中。例如,將同源性的“上游”區(qū)克隆到退火位點1和2中,而在一次單獨的克隆中,將同源性的“下游”區(qū)克隆到退火位點3和4中。一旦鑒定出含有同源性的每個單一區(qū)的克隆,則可以通過用多種限制性酶消化每個克隆,其中一種酶在退火位點1之外(例如圖2A中的Not I)消化,而另一種酶在正選擇標記和退火位點3之間(例如圖2A中的Sal I)消化,來構建含有這兩個同源性區(qū)的打靶構建體。純化(通過通過凝膠電泳)含有來自每種構建體的側翼同源性區(qū)的片段,用本領域已知的標準連接技術進行將其混合,產(chǎn)生所得的打靶構建體。
在再一實施方案中,按照本發(fā)明的一個方面構建體可以用一步四向連接法構成。如上所述處理所述載體和片段。簡而言之,處理所述載體,以形成兩個片段,每個片段在每一端具有一個特異性序列的單鏈尾。同樣,也處理PCR擴增的側翼片段,以形成與所述載體片段的單鏈尾互補的單鏈尾。如上所述將經(jīng)處理的載體片段和所述側翼片段混合,并且讓其退火。因為所述單鏈尾具有特異性,所以最終的構建體將含有被正選擇標記分開的正確定向的所述片段。
在細菌中擴增最終的質粒構建體,將其純化,然后可以將其導入ES細胞中,或于-20℃凍存待用。當需要時,將所述載體導入胚胎干細胞系中(例如通過電穿孔),選擇其中所導入的DNA與所述內源DNA發(fā)生了同源重組的細胞(參見例如Li等,Cell,6991526(1992))。然后將所選細胞注射到動物(例如小鼠)的胚泡(或適用于產(chǎn)生有活力動物的其它發(fā)育階段,例如桑椹胚)中,形成嵌合體(參見例如Bradley,A.Teratocarcinomas and Embryonic Stem CellsA Practical Approach,E.J.Robertson編著,IRL,Oxford,第113-152頁(1987))?;蛘?,可以讓所選ES細胞與分離的小鼠胚胎細胞聚集,形成團聚嵌合體。然后可以將嵌合胚胎植入合適的假孕代母動物體內,讓胚胎生長至足月。在其生殖細胞中帶有同源重組的DNA的嵌合子代,可以用來繁育出其所有的細胞均含有所述同源重組的DNA的動物。在一個實施方案中,嵌合子代小鼠用來產(chǎn)生在靶基因中帶有雜合破壞的小鼠??梢宰岆s合敲除小鼠交配。本領域眾所周知,通常這種交配的1/4子代將在靶基因中具有純合破壞。
然后將雜合敲除小鼠以及純合敲除小鼠與正常的野生型小鼠比較,以確定所述靶基因的破壞是否引起表型改變,尤其是病理學改變。在一個實施方案中,所述靶DNA序列是T243,與普通正常野生型成年小鼠相比,純合敲除小鼠的體重降低。體重通常降低至少約15%,更常見降低約30-90%,甚至更通常較低約40-80%;最常見降低約60-70%。
在另一實施方案中,與普通正常野生型成年小鼠相比,純合敲除小鼠的身長降低。身長通常降低至少約10%,常常降低15-50%;更常見降低約20-40%,最常見降低約25-35%。
與正常野生型成年小鼠相比,體重與身長之比也可以降低。通常,體重與身長之比降低至少約20%,更常見降低約25-75%,更常見降低約30-65%,最常見降低約40-55%。
也觀察到表型包括身長和體重均降低的小鼠。這類小鼠也可以表現(xiàn)出體重與身長之比降低。
在本發(fā)明的另一實施方案中,所述敲除小鼠的表型包括軟骨病和/或骨病。通常,在該實施方案中,有軟骨異常并且骨生成普遍減少。
本文所用的“疾病”是指機體狀態(tài)或機體某些器官的任何改變,中斷或擾亂了生活機能的執(zhí)行、以及引起疼痛或虛弱或有疼痛或虛弱的危險。疾病也可以被認為包括機體任何部分、器官或系統(tǒng)(或其組合)的正常結構或功能的任何偏差或中斷,其表現(xiàn)為特征性的一種或一組癥狀和/或體征,其病因學、病理學和/或預后可以是已知或未知的。
通常觀察到的病理學病癥包括中軸骨骼和附肢骨骼都縮短。四肢的近端和遠端骨按比例縮短。關節(jié)軟骨缺乏愛茜藍染色。該實施方案的其它方面包括股骨遠端的生長板薄以及骺軟骨薄至缺乏。所述疾病也可能有微小骨折,提示生長板脆性。在該實施方案中,在長骨體生長部內增殖區(qū)和肥大區(qū)中的軟骨細胞柱短。干骺端內軟骨性針狀體(spicule)短并且間隔寬;偶爾出現(xiàn)的針狀體偶然定向。成骨細胞豐富并且常常沿軟骨性針狀體堆積。骺軟骨薄并且常常被纖維性結締組織所取代。骺表面的愛茜藍染色也減弱。骨骺/長骨體生長部連接處的軟骨略微向外張開,有伸出在長骨體生長部之上的不規(guī)則的凸出邊緣。該實施方案中也包括胸骨板不規(guī)則;生長板或者缺乏或者不連續(xù)。大的不規(guī)則的軟骨島延伸到胸骨板體中,偶然有第二骨化中心。軟骨邊緣也可能向外張開。另一方面包括不定骨化的椎體,所述椎體可能小并且主要是軟骨性的。這些主要是軟骨性的椎體的生長板不規(guī)則且薄,側突漸尖。在本發(fā)明的一個方面,所述疾病被鑒定為軟骨發(fā)育不良。
在本發(fā)明的再一方面,所述敲除小鼠的表型包括腎病。通常,所述腎小且缺乏正常的結構。皮質薄,并且某些腎小球可能在被膜下。被膜下的腎小球是小而皺縮的、多細胞的腎小球叢。皮質髓質區(qū)可能沒有放射狀弓形管和獨特的管形。皮質髓質連接處內的腎小管上皮細胞隨機排列成片、堆和簇。某些腎小管上皮細胞小且嗜堿染色暗,顯示有再生。在兩個腎中通常存在發(fā)育異常性改變,最主要存在于皮質髓質連接處,在皮質較之存在較少。按照本發(fā)明的一個方面,所述腎病被鑒定為腎發(fā)育不良。
也可以觀察到病理學狀態(tài)的其它病癥。
可以加入到本發(fā)明所述載體中的額外特征包括應用重組酶靶位點。噬菌體P1 Cre重組酶和來自酵母質粒的flp重組酶是位點專一性DNA重組酶的兩個非限制性實例,位點專一性DNA重組酶在特定的靶位點切割DNA(cre重組酶在lox P位點切割,而flp重組酶在frt位點切割),并且催化該DNA連接至第二切割位點。已經(jīng)描述了許多合適的可供選擇的位點專一性重組酶,其基因可以按照本發(fā)明的方法應用。這類重組酶包括噬菌體λ的Int重組酶(帶有或不帶有Xis)(Weisberg,R.等,Lambda II,(Hendrix,R.等編著),Cold Spring HarborPress,Cold Spring Harbor,NY,第211-50頁(1983),通過引用結合到本文中)、TpnI和β-內酰胺酶轉座子(Mercier等,J.Bacteriol.,1723745-57(1990))、Tn3解離酶(Flanagan和Fennewald J.Molec.Biol.,206295-304(1989);Stark等,Cell,58779-90(1989))、酵母重組酶(Matsuzaki等,J.Bacteriol.,172610-18(1990))、枯草桿菌SpoIVC重組酶(Sato等,J.Bacteriol.,1721092-98(1990))、Flp重組酶(Schwartz和Sadowski,J.Molec.Biol.,205647-658(1989);Parsons等,J.Biol.Chem.,2654527-33(1990);Golic和Lindquist,Cell,59499-509(1989);Amin等,J.Molec.Biol.,21455-72(1990))、Hin重組酶(Glasgow等,J.Biol.Chem.,26410072-82(1989))、免疫球蛋白重組酶(Malynn等,Cell 54453-460(1988))、和Cin重組酶(Haffter和Bickle,EMBO J.,73991-3996(1988);Hubner等,J.Molec.Biol.,205493-500(1989)),所有這些文獻都通過引用結合到本文中。Echols(J.Biol.Chem.,26514697-14700(1990))、deVillartay(Nature,335170-74(1988))、Craig(Ann.Rev.Genet.,2277-105(1988))、Poyart-Salmeron等(EMBO J.82425-33(1989))、Hunger-Bertling等(Mol Cell.Biochem.,92107-16(1990))以及Cregg和Madden(Mol.Gen.Genet.,219320-23(1989))討論了這類系統(tǒng),所有上述文獻通過引用結合到本文中。
Cre已經(jīng)被純化至均質,它與loxP位點的反應已被廣泛地表征(Abremski和Hess J.Mol.Biol.2591509-14(1984),該文獻通過引用結合到本文中)。Cre蛋白的分子量為35,000,在市場上可以從NewEngland Nuclear/Du Pont獲得。cre基因(它編碼Cre蛋白)已被克隆和表達(Abremski等Cell 321301-11(1983),該文獻通過引用結合到本文中)。Cre蛋白介導兩個loxP序列之間的重組(Sternberg等Cold SpringHarbor Symp.Quant.Biol.45297-309(1981)),所述loxP序列可以存在于相同或不同的DNA分子上。因為loxP位點的內部間隔序列是不對稱的,所以兩個loxP位點可以表現(xiàn)出相互之間相對定向(Hoess和Abremski Proc.Natl.Acad.Sci.U.S.A.811026-29(1984))。因此,當同一DNA分子上的兩個位點為同向重復定向時,Cre將切割所述位點之間的DNA(Abremski等Cell 321301-11(1983))。然而,如果所述位點相互之間相對倒位,則所述位點之間的DNA在重組后不被切割,而僅僅是倒位。因此,具有兩個同向loxP位點的環(huán)狀DNA分子將重組產(chǎn)生兩個較小的環(huán),而具有反向的兩個loxP位點的環(huán)狀分子僅僅將側翼為loxP位點的DNA序列倒位。另外,當在不同的DNA分子上存在靶時,重組酶的作用可以導致遠離所述靶位點的區(qū)域相互交換。
對于在敲除模型中鑒定基因功能而言,重組酶具有重要的應用。當本文所述的構建體用來破壞靶基因時,當所述正選擇標記的插入發(fā)生在靶基因翻譯起始位點下游(3’)時,可以產(chǎn)生融合轉錄物。所述融合轉錄物可能產(chǎn)生某一水平的蛋白表達,其后果是未知的。已經(jīng)提出,正選擇標記的插入可以影響附近基因的表達。這些影響可能使得難以確定敲除事件之后的基因功能,因為不可能辨別給定表型是與基因的失活有關,還是與附近基因的轉錄有關。這兩種潛在的問題都可以通過利用重組酶活性來解決。當正選擇標記的側翼為同向的重組酶位點時,添加相應的重組酶將導致除去所述正選擇標記。因而避開了由正選擇標記或融合轉錄物表達引起的影響。
對于鑒定與TRP靶基因相關的疾病而言,功能喪失或無效突變模型可能是不合適的。許多已發(fā)表的報道提出,TRP中三核苷酸重復區(qū)的擴增使得所產(chǎn)生的蛋白質不利地獲得功能。這類功能的獲得可能涉及新型的或增強的與其它蛋白質的相互作用、增強對蛋白酶降解的抗性、蛋白質折疊異常和/或大的不溶性蛋白形式的毒性積累。因此,模擬TRP中三核苷酸重復的擴增以確定擴增是否引起可能與功能獲得相關的表型改變,可能具有很大價值。因此,本發(fā)明的一個實施方案將涉及應用重組酶以引起合成的三核苷酸重復在靶基因破壞位點的酶輔助位點專一性整合。該實施方案將涉及重組酶催化遠離存在于不同分子上的兩個靶位點的DNA交換的重組酶系統(tǒng)的相互交換能力。當用來產(chǎn)生敲除干細胞的打靶構建體包含鄰接正選擇標記的一個重組酶靶位點時,在重組酶存在下,在該位點和合成核酸上存在的第二位點之間可以發(fā)生重組。
本領域技術人員會認識到,會容易地合成所述合成核酸,以使其包含所述重組酶靶位點和任何所需序列重復的三核苷酸。例如,所述合成核酸序列可以包括編碼亮氨酸的CTG重復、或編碼谷氨酰胺的CAG重復。所述合成核酸優(yōu)選具有至少約20個三核苷酸重復;更優(yōu)選具有至少約40個三核苷酸重復;最優(yōu)選具有至少約100個三核苷酸重復。
技術人員也會認識到,采用用于導入DNA的任何標準實驗室方法,包括但不限于轉染、脂質體轉染或電穿孔,可以使所述合成核酸與已破壞的基因接觸。
在一個實施方案中,通過直接微注射,將純化的重組酶提供給所述細胞。在另一實施方案中,由其中重組酶基因與有功能的啟動子有效連接的共轉染的構建體或載體,表達所述重組酶。該實施方案的另一方面是應用組織特異性或誘導型重組酶構建體,這使得可以選擇何時何地發(fā)生重組。用于實施誘導型形式的重組酶介導的重組的一種方法,涉及利用誘導型或組織特異性啟動子或其它基因調節(jié)元件表達所需重組酶活性的載體的應用。最好將誘導型表達元件有效定位,以允許誘導型地控制或激活所需重組酶活性的表達。這類誘導型啟動子或其他基因調節(jié)元件的實例包括但不限于四環(huán)素效應啟動子、金屬硫蛋白效應啟動子、蛻皮激素效應啟動子和其它類固醇效應啟動子、雷帕霉素效應啟動子等(No等,Proc.Natl.Acad.Sci.USA,933346-51(1996);Furth等Proc.Natl.Acad.Sci.USA,919302-6(1994))??梢允褂玫钠渌刂圃ㄐ枰囟ㄞD錄因子的啟動子,例如病毒啟動子。加入這類啟動子的載體可以僅在表達所需轉錄因子的細胞中表達重組酶活性。
所述TRP基因序列也可以用來產(chǎn)生TRP基因產(chǎn)物。TRP基因產(chǎn)物可以包括代表功能等同的基因產(chǎn)物的蛋白質。這種等同的基因產(chǎn)物可以在本文所述基因序列所編碼的氨基酸序列中含有氨基酸殘基缺失、添加或取代,但這些導致沉默改變,因此產(chǎn)生功能等同的TRP基因產(chǎn)物。可以根據(jù)所涉及殘基的極性、電荷、溶解性、疏水性、親水性和/或兩親性質方面的相似性來進行氨基酸取代。
例如,非極性(疏水性)氨基酸包括丙氨酸、亮氨酸、異亮氨酸、纈氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸;極性中性氨基酸包括甘氨酸、絲氨酸、蘇氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;正電性(堿性)氨基酸包括精氨酸、賴氨酸和組氨酸;而負電性(酸性)氨基酸包括天冬氨酸和谷氨酸。本文所用的“功能等同物”是指能夠顯示出體內活性與所述TRP基因序列所編碼的內源基因產(chǎn)物基本相似的蛋白質?;蛘?,當用作測定的一部分時,“功能等同物”可以指能夠以與內源基因產(chǎn)物的相應部分作用方式相似的方式與其它細胞分子或胞外分子相互作用的肽。
按照本發(fā)明方法有用的其它TRP蛋白產(chǎn)物是用重組法或合成法產(chǎn)生的由TRP衍生或基于TRP的肽(TRP衍生肽)。
也可以產(chǎn)生其中例如通過定點誘變有意擴增所述三核苷酸區(qū)的突變型TRP蛋白。也可以使用在干細胞中通過酶輔助位點專一性整合擴增的TRP。
可以采用本領域眾所周知的技術,通過重組DNA技術產(chǎn)生TRP和擴增型TRP基因產(chǎn)物。因此,本文描述了通過表達編碼基因序列的核酸制備本發(fā)明的基因多肽和肽的方法??梢杂帽绢I域技術人員熟知的方法,構建含有基因蛋白編碼序列和合適轉錄/翻譯控制信號的表達載體。這些方法包括例如體外重組DNA技術、合成技術和體內重組/遺傳重組(參見例如Sambrook等,1989,參見上文,和Ausubel等,1989,參見上文)?;蛘撸褂美缱詣雍铣蓛x,可以化學合成能夠編碼基因的蛋白序列的RNA(參見例如Oligonucleotide SynthesisA PracticalApproach,Gait,M.J.編著,IRL Press,Oxford(1984))。
可以利用各種各樣的宿主-表達載體系統(tǒng),來表達本發(fā)明的基因編碼序列。這類宿主-表達系統(tǒng)代表可以用來產(chǎn)生目的編碼序列并且隨后進行純化的載體、但也代表當用所述合適的核苷酸編碼序列轉化或轉染時可以原位表現(xiàn)出本發(fā)明的基因蛋白的細胞。這些包括但不限于用含有基因蛋白編碼序列的重組噬菌體DNA、質粒DNA或粘粒DNA表達載體轉化的微生物例如細菌(例如大腸桿菌、枯草桿菌);用含有所述基因蛋白編碼序列的重組酵母表達載體轉化的酵母(例如酵母屬(Saccharomyces)、畢赤酵母屬(Pichia));用含有所述基因蛋白編碼序列的重組病毒表達載體(例如桿狀病毒)感染的昆蟲細胞系統(tǒng);用含有基因蛋白編碼序列的重組病毒表達載體(例如花椰菜花葉病毒CaMV;煙草花葉病毒,TMV)感染的或用含有基因蛋白編碼序列的重組質粒表達載體(例如Ti質粒)轉化的植物細胞系統(tǒng);或帶有含得自哺乳動物細胞基因組的啟動子(例如金屬硫蛋白啟動子)或得自哺乳動物病毒的啟動子(例如腺病毒晚期啟動子;痘苗病毒7.5K啟動子)的重組表達構建體的哺乳動物細胞系統(tǒng)(例如COS、CHO、BHK、293、3T3)。
在細菌系統(tǒng)中,最好可以根據(jù)待表達基因蛋白的計劃的應用,對多種表達載體進行選擇。例如,當要產(chǎn)生大量的這種蛋白質以產(chǎn)生抗體或篩選肽文庫時,可能最好是例如指導高水平容易純化的融合蛋白產(chǎn)物表達的載體。這類載體包括但不限于大腸桿菌表達載體pUR278(Ruther和Muller-Hill,EMBO J.,21791-94(1983)),其中所述基因蛋白編碼序列可以單獨地與lac Z編碼區(qū)符合讀框地連接到所述載體中,使得產(chǎn)生融合蛋白;pIN載體(Inouye和Inouye,Nucleic Acids Res.,133101-09(1985);Van Heeke和Schuster,J.Biol.Chem.,2645503-9(1989))等。也可以用pGEX載體來表達作為與谷胱甘肽S-轉移酶(GST)融合的融合蛋白的外源多肽。一般而言,這類融合蛋白是可溶性的,通過吸附至谷胱甘肽-瓊脂糖微珠、然后在游離谷胱甘肽存在下洗脫,可以容易地從裂解細胞中純化。設計pGEX載體,使其包括凝血酶或因子Xa蛋白酶切割位點,使得所克隆的靶基因蛋白可以從GST部分釋放出來。
在一個優(yōu)選實施方案中,采用標準PCR法(Innis等(編著)PCRProtocolsA Guide to Methods and Applications,Academic Press,SanDiego(1990)),在氨基末端與Bam HI位點以及在羧基末端與Eco RI位點符合讀框地加入全長cDNA序列,并且連接到pGEX-2TK載體(Pharmacia,Uppsala,Sweden)中。所得的cDNA構建體在氨基末端含有一個用于放射性標記的激酶識別位點以及在羧基末端含有用于親和純化的谷胱甘肽S-轉移酶序列(Nilsson等,EMBO J.,41075-80(1985);Zabeau和Stanley,EMBO J.,11217-24(1982))。
在昆蟲系統(tǒng)中,用苜蓿銀紋夜蛾(Autographa californica)核型多角體病毒(AcNPV)作為表達外源基因的載體。該病毒在草地貪夜蛾(Spodoptera frugiperda)細胞中生長??梢詫⑺龌蚓幋a序列單獨克隆到該病毒的非必需區(qū)(例如多角體蛋白基因),并置于AcNPV啟動子(例如多角體蛋白啟動子)的控制之下。成功插入基因編碼序列,將導致多角體蛋白基因失活,并產(chǎn)生非包含體型重組病毒(即缺乏多角體蛋白基因編碼的蛋白性外殼)。然后,用這些重組病毒感染草地貪夜蛾細胞,在此表達所插入的基因(參見例如Smith等,J.Virol.46584-93(1983);Smith,美國專利第4,745,051號)。
在哺乳動物宿主細胞中,可以利用多種基于病毒的表達系統(tǒng)。在用腺病毒作為表達載體的情況下,可以將目的基因編碼序列連接于腺病毒轉錄/翻譯控制復合體,例如晚期啟動子和三聯(lián)前導序列。然后通過體外或體內重組,將這種嵌合基因插入腺病毒基因組中。插入病毒基因組的非必需區(qū)(例如E1區(qū)或E3區(qū))中,將產(chǎn)生有活力并且能夠在受感染宿主中表達基因蛋白的重組病毒(參見例如Logan和Shenk,Proc.Natl.Acad.Sci.USA,813655-59(1984))。所插入的基因編碼序列的有效翻譯,也可能需要特定的起始信號。這些信號包括ATG起始密碼子和鄰近的序列。在將包括自身起始密碼子和鄰近序列的完整基因插入合適表達載體的情況下,可能不需要額外的翻譯控制信號。然而,在僅插入所述基因編碼序列的一部分的情況下,必須提供外源翻譯控制信號,也許包括ATG起始密碼子。此外,起始密碼子必須與所需編碼序列符合讀框,以確保翻譯完整的插入片段。這些外源翻譯控制信號和起始密碼子可以具有多種來源,可以是天然的和合成的。通過包括合適的轉錄增強子元件、轉錄終止子等,可以增強表達效率(參見Bitter等,Methods in Enzymol.,153516-44(1987))。
另外,可以選擇調節(jié)所插入序列的表達、或以特定所需方式修飾和加工所述基因產(chǎn)物的宿主細胞株。蛋白產(chǎn)物的這類修飾(例如糖基化)和加工(例如切割)對于所述蛋白的功能可能是重要的。不同的宿主細胞具有蛋白的翻譯后加工和修飾的特征性和特定的機制。可以選擇合適的細胞系或宿主系統(tǒng),以確保正確的修飾和加工所表達的外源蛋白。為此,可以使用具有初級轉錄物的正確加工、所述基因產(chǎn)物的糖基化和磷酸化的細胞機制的真核宿主細胞。這類哺乳動物宿主細胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38等。
對于重組蛋白的長期高產(chǎn)的生產(chǎn),最好是穩(wěn)定的表達。例如,對穩(wěn)定表達所述基因蛋白的細胞系進行工程改造。不用含有病毒復制起點的表達載體,而是用由合適表達控制元件(例如啟動子、增強子、序列、轉錄終止子、聚腺苷酸化位點等)控制的DNA和選擇標記轉化宿主細胞。在導入外源DNA后,可以讓工程細胞在富集培養(yǎng)基中生長1-2天,然后轉換到選擇培養(yǎng)基中。重組質粒中的選擇標記提供對所述選擇的抗性,使得在染色體中穩(wěn)定整合所述質粒的細胞可以生長,形成轉化灶,進而將所述轉化灶克隆并發(fā)展為細胞系。這種方法可以有利地用來工程改變表達所述基因蛋白的細胞系。這類工程細胞系在影響所述基因蛋白內源活性的化合物的篩選和評估方面尤其有用。
在一個優(yōu)選實施方案中,所述重組蛋白的表達時間和/或表達量的控制可以采用誘導型表達構建體來控制。誘導型構建體和用于誘導型表達重組蛋白的系統(tǒng)是本領域技術人員眾所周知的。這類誘導型啟動子或其它基因調節(jié)元件的實例包括但不限于四環(huán)素效應啟動子、金屬硫蛋白效應啟動子、蛻皮激素效應啟動子和其它類固醇效應啟動子、雷帕霉素效應啟動子等(No等,Proc.Natl.Acad Sci.USA,933346-51(1996);Furth等,Proc.Natl.Acad.Sci.USA,919302-6(1994))??梢允褂玫钠渌刂圃ㄐ枰囟ㄞD錄因子的啟動子,例如病毒啟動子,特別是HIV啟動子。在一個實施方案中,利用Tet誘導型基因表達系統(tǒng)。(Gossen和Bujard,Proc.Natl.Acad.Sci.USA,895547-51(1992);Gossen等,Science,2681766-69(1995))。Tet表達系統(tǒng)基于得自大腸桿菌Tn10轉座子的四環(huán)素抗性操縱子的兩個調節(jié)元件-四環(huán)素阻抑蛋白(TetR)和TetR結合的四環(huán)素操縱基因序列(tetO)。使用這種系統(tǒng),可以將所述重組蛋白的表達置于tetO操縱基因序列的控制之下,將該系統(tǒng)轉染或轉化到宿主細胞中。在共轉染到宿主細胞中的TetR存在下,由于TetR蛋白與tetO調節(jié)元件結合,因此所述重組蛋白的表達受到阻抑。然后,對不同濃度的與tetO元件競爭與TetR結合的四環(huán)素(Tc)或Tc衍生物(例如強力霉素(Dox))應答,可以誘導出高水平的受調節(jié)的基因表達。用于tet誘導型基因表達的構建體和材料在市場上可得自CLONTECH Laboratories,Inc.,Palo,Alto,CA。
當用作測定系統(tǒng)的組分時,可以將所述基因蛋白或者直接或者間接地標記,以便于檢測所述基因蛋白和試驗物質之間形成的復合物??梢允褂枚喾N合適標記系統(tǒng)中的任一種,包括但不限于放射性同位素例如125I;當暴露于底物時產(chǎn)生可檢測比色(calorimetric)信號或光的酶標記系統(tǒng);和熒光標記。
在使用重組DNA技術產(chǎn)生用于這類測定系統(tǒng)的基因蛋白的情況下,可能最好是對融合蛋白進行工程改造,這可以便于標記、固定化和/或檢測。
間接標記涉及應用與任一基因產(chǎn)物特異性結合的蛋白質,例如標記的抗體。這類抗體包括但不限于多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和由Fab表達文庫產(chǎn)生的片段。
本文描述了用于生產(chǎn)能夠特異性地識別一種或多種基因表位的抗體的方法。這類抗體可能包括但不限于多克隆抗體、單克隆抗體(mAb)、人源化或嵌合抗體、單鏈抗體、Fab片段、F(ab’)2片段、由Fab表達文庫產(chǎn)生的片段、抗獨特型(抗Id)抗體和任一種上述抗體的表位結合片段。這類抗體可以用來例如檢測生物樣品中的靶TRP基因,或者用作抑制異常靶基因活性的方法。因此,這類抗體可以用作疾病治療方法的一部分,和/或可以用作檢驗患者異常靶TRP基因蛋白水平或異常形式的這類蛋白存在的診斷技術的一部分。
關于針對基因的抗體的生產(chǎn),可以通過注射TRP蛋白或其部分,免疫各種宿主動物。這類宿主動物可以包括但不限于兔、小鼠和大鼠,這僅例舉了幾個實例。根據(jù)宿主的物種,可以使用各種佐劑來增強免疫應答,所述佐劑包括但不限于弗氏(完全和不完全)佐劑、礦物凝膠例如氫氧化鋁、表面活性劑例如溶血卵磷脂、多聚醇(pluronic polyol)、聚陰離子、肽類、油乳液、匙孔血藍蛋白、二硝基苯酚和潛在有用的人用佐劑,例如BCG(卡介苗)和小棒桿菌(Corynebacteriumparvum)。
多克隆抗體是從用抗原(例如靶基因產(chǎn)物)或其抗原性功能衍生物免疫的動物血清獲得的不均一的抗體分子群體。對于多克隆抗體的生產(chǎn),可以通過注射補充有如上所述的佐劑的基因產(chǎn)物免疫宿主動物,例如如上所述的動物。
作為抗特定抗原的均一抗體群體的單克隆抗體,可以采用用于在培養(yǎng)物中由連續(xù)細胞系生產(chǎn)抗體分子的任何技術獲得。這些技術包括但不限于Khler和Milstein(Nature,256495-7(1975)和美國專利第4,376,110號)的雜交瘤技術;人類B細胞雜交瘤技術(Kosbor等,Immunology Today,472(1983);Cote等,Proc.Natl.Acad.Sci.USA,802026-30(1983));和EBV-雜交瘤技術(Cole等,Monoclohal AntibodiesAnd Cancer Therapy,Alan R.Liss,Inc.,New York,第77-96頁(1985))。這類抗體可以屬于任何類別的免疫球蛋白,包括IgG、IgM、IgE、IgA、IgD和其任何亞類。生產(chǎn)本發(fā)明mAb的雜交瘤可以在體外或體內培養(yǎng)。在體內產(chǎn)生高效價的mAb構成了本發(fā)明優(yōu)選的生產(chǎn)方法。
另外,可以使用開發(fā)用于產(chǎn)生“嵌合抗體”的技術(Morrison等,Proc.Natl.Acad.Sci.,816851-6855(1984);Tekeda等,Nature,314452-54(1985)),該技術通過將來自具合適抗原特異性的小鼠抗體分子的基因與來自具合適生物活性的人類抗體分子的基因剪接在一起,產(chǎn)生“嵌合抗體”。嵌合抗體是其中不同的部分來源于不同動物物種的分子,例如具有來源于鼠類mAb的可變區(qū)和人類免疫球蛋白的恒定區(qū)的分子。
或者,可以采用描述的產(chǎn)生單鏈抗體的技術(美國專利第4,946,778號;Bird,Science 242423-36(1988);Huston等,Proc.Natl.Acad.Sci.USA,855879-83(1988);和Ward等,Nature,334544-46(1989)),來生產(chǎn)基因-單鏈抗體。單鏈抗體是通過將Fv區(qū)的重鏈和輕鏈片段通過氨基酸橋連接產(chǎn)生單鏈多肽而形成的。
識別特定表位的抗體片段可以采用已知的技術產(chǎn)生。例如,這類片段包括但不限于F(ab’)2片段,它通過用胃蛋白酶消化所述抗體分子而產(chǎn)生的;和Fab片段,它通過還原F(ab’)2片段的二硫橋而產(chǎn)生?;蛘撸梢詷嫿‵ab表達文庫(Huse等,Science,2461275-81(1989)),以便快速容易地鑒定具有所需特異性的單克隆Fab片段。
本文描述了可以用作疾病模型的基于細胞和基于動物的系統(tǒng)。包括但不限于小鼠、大鼠、兔、豚鼠、豬、微型豬(micro-pig)、山羊和非人類靈長類動物(例如狒狒、猴子和黑猩猩)的任何物種的動物,都可以用來產(chǎn)生疾病動物模型。另外,可以使用得自人類的細胞。這些系統(tǒng)可以用于各種各樣的應用中。例如,基于細胞和基于動物的模型系統(tǒng)可以用來進一步鑒定TRP基因。這類測定可以用作篩選策略的一部分,其中所述策略設計用來鑒定能夠緩解病癥的化合物。因此,可以用基于動物和基于細胞的模型,來鑒定在治療疾病中有效的藥物、藥劑、療法和干涉。
含有并表達編碼TRP的靶基因序列、以及進一步顯示出與疾病相關的細胞表型的細胞,可以用來鑒定顯示出抗病活性的化合物。
這類細胞可以包括非重組單核細胞細胞系,例如U937(ATCC#CRL-1593)、THP-1(ATCC#TIB-202)和P388D1(ATCC#TIB-63);內皮細胞,例如HUVEC和牛主動脈內皮細胞(BAEC);以及一般的哺乳動物細胞系,例如HeLa細胞和COS細胞,例如COS-7(ATCC#CRL-1651)。此外,這類細胞可以包括重組、轉基因細胞系。例如,本發(fā)明的敲除小鼠可以用來產(chǎn)生可以用作疾病的細胞培養(yǎng)物模型的細胞系,包括與疾病相關的一種或多種細胞類型。雖然可以利用來源于本發(fā)明的疾病轉基因動物的細胞、組織和原代培養(yǎng)物,但最好是產(chǎn)生連續(xù)細胞系。關于可以用來從所述轉基因動物得到連續(xù)細胞系的技術的實例,參見Small等,Mol.Cell Biol.,5642-48(1985)。
可以將靶基因序列導入目的細胞的基因組中,或在所述基因組中過量表達,或者如果存在內源靶基因序列,則可以或者使其過量表達,或者將其破壞,以使靶基因的表達表達不足或使其失活。
為了過量表達靶基因序列,可以將靶基因序列的編碼部分與能夠在目的細胞類型中驅動基因表達的調節(jié)序列連接。這類調節(jié)區(qū)是本領域技術人員眾所周知的,可以在不用過多實驗的情況下利用。
為了使內源靶基因序列表達不足,可以分離出這種序列并對其進行工程改造,使得當將其再導入目的細胞類型的基因組中時,所述內源靶基因等位基因被失活。最好是,通過基因打靶導入工程靶基因序列,使得將所述工程靶基因序列整合到所述細胞的基因組中時,內源靶基因序列被破壞。
可以檢查用靶基因轉染的細胞的與疾病相關的表型。
經(jīng)分析鑒定的化合物可以用以例如詳細闡述靶基因產(chǎn)物的生物功能以及緩解疾病。在病癥的病因是靶基因表達和/或靶基因產(chǎn)物在細胞或組織中的總體水平較低的情況下,與所述靶基因產(chǎn)物相互作用的化合物可以包括增強或放大結合的靶基因蛋白活性的化合物。這類化合物可能導致有效提高靶基因產(chǎn)物的活性水平,因而緩解癥狀。
可以設計體外系統(tǒng),以鑒定能夠結合靶TRP基因或擴增型TRP基因的化合物。這類化合物可以包括但不限于由D-和/或L-構型的氨基酸組成的肽(例如隨機肽文庫的形式;參見例如Lam等,Nature,35482-4(1991))、磷酸肽(例如為隨機或部分簡并的定向磷酸肽文庫形式;參見例如Songyang等,Cell,72767-78(1993))、抗體和小的有機或無機分子。經(jīng)鑒定的化合物可以用于例如調節(jié)靶基因蛋白的活性、最好是突變型靶基因蛋白的活性,可以用于詳細闡述靶基因蛋白的生物功能,可以用于鑒定破壞正常靶基因相互作用的化合物的篩選中,或其本身可以破壞這類相互作用。
用來鑒定與靶基因蛋白結合的化合物的測定的原理,包括制備靶基因蛋白或擴增型靶基因蛋白和試驗化合物在足以允許所述兩種組分相互作用和結合的條件和時間下的反應混合物,由此在反應混合物中形成可以被取出和/或檢測的復合物。這些測定可以以各種各樣的方式進行。例如,進行這種測定的一種方法涉及將所述靶基因蛋白或擴增型靶基因蛋白或所述試驗物質錨定在固相上,并且在反應結束時檢測錨定在固相上的靶基因蛋白或擴增型靶基因蛋白/試驗物質復合物。在這種方法的一個實施方案中,可以將所述靶基因蛋白錨定在固體表面上,而將未錨定的所述試驗化合物直接或間接標記。
實際上,可方便地使用微量滴定板。被錨定的組分可以通過非共價或共價連接而被固定化。非共價連接可以簡單地通過用所述蛋白溶液包被所述固體表面并干燥來完成。或者,可以用對所述蛋白特異性的固定化抗體、最好是單克隆抗體,將所述蛋白錨定到固體表面。所述表面可以預先制備和貯存。
為了進行所述測定,將非固定化組分加入至含有錨定的組分的包被表面上。在反應完成之后,在使得所形成的任何復合物保持固定化于固體表面的條件下,除去未反應的組分(例如通過洗滌)。錨定于固體表面的復合物的檢測可以以多種方式完成。在對先前非固定化組分進行預標記的情況下,檢測到固定化于所述表面的標記,指示形成了復合物。在對先前非固化組分不進行預標記的情況下,可以用間接標記來檢測錨定于所述表面的復合物;例如采用對先前非固定化組分特異性的標記抗體(可以進而用標記的抗Ig抗體對所述抗體直接或間接標記)。
或者,可以在液相中進行反應,從未反應組分中分離出反應產(chǎn)物,檢測復合物;例如采用對靶基因產(chǎn)物或試驗化合物特異性的固定化抗體來錨定溶液中形成的任何復合物,和用對可能的復合物的另一組分特異性的標記抗體來檢測錨定復合物。
可以對通過上述方法之一顯示出與特定靶基因產(chǎn)物結合的化合物,進一步測試其從所述靶基因蛋白引發(fā)生化反應的能力。
基于細胞的系統(tǒng)可以用來鑒定可以用來緩解病癥的化合物。例如,可以將這類細胞系統(tǒng)暴露于懷疑顯示出緩解病癥能力的化合物,所述化合物的濃度和暴露時間足以在經(jīng)暴露的細胞中引發(fā)這種病癥的緩解。在暴露之后,檢查細胞,以確定一種或多種所述疾病的細胞表型是否已經(jīng)改變?yōu)轭愃聘鼮檎;蚋咏吧偷姆羌膊”硇汀?br>
另外,基于動物的疾病系統(tǒng),例如本文所述的系統(tǒng),可以用來鑒定能夠緩解病癥的化合物。這類動物模型可以用作用于鑒定在治療所述動物的疾病或其它特征性的表型方面有效的藥物、藥劑、療法和干涉的試驗作用物。例如,可以將動物模型暴露于懷疑顯示出緩解病癥能力的化合物或因子,所述化合物或因子的濃度和暴露時間足以在經(jīng)暴露的動物中引發(fā)這種病癥的緩解??梢酝ㄟ^評價與該疾病相關的病癥的逆轉,監(jiān)測所述動物對該暴露的反應。暴露可以包括在本文所述的模型動物妊娠期間治療母畜,從而使胚胎或胎兒暴露于可以預防或緩解所述疾病或表型的化合物或因子。也可以對新生動物、幼年動物和成年動物進行暴露。
相似的病癥可能由多種病因所致。例如,軟骨發(fā)育不良包括一組寬范圍的骨畸形,其形成原因可能是生成缺陷型膠原蛋白、信號分子[胰島素樣生長因子(IGF)、甲狀旁腺激素相關蛋白(PTHrP)、Indianhedgehog(Ihh)、骨形態(tài)發(fā)生蛋白(BMP)]被破壞或者構成軟骨基質的蛋白聚糖(即聚集蛋白聚糖)異常。已描述的人類原發(fā)性骨病包括成骨不全(合成了缺陷型I型膠原蛋白)、粘多糖病(導致基質異常的溶酶體貯積病)、Blomstrand軟骨發(fā)育不良(缺乏PTH/PTHrP激素和/或受體)、多發(fā)性骨骺發(fā)育不良(缺陷型IX型膠原蛋白)和Schmid干骺端軟骨發(fā)育不良(合成缺陷型X型膠原蛋白)。因為有缺陷型軟骨和/或軟骨基質,所以礦化作用和骨生成減少。術語骨質疏松用來指骨質量的總體減少,包括原發(fā)性病癥和繼發(fā)性病癥。原發(fā)性骨質疏松癥包括特發(fā)性青少年骨質疏松、特發(fā)性中年(middle adulthood)骨質疏松、經(jīng)絕后骨質疏松和老年骨質疏松。可以導致骨質疏松的繼發(fā)性病癥包括內分泌性疾病(甲狀旁腺機能亢進、甲狀腺機能亢進、甲狀腺機能減退、性腺機能減退、肢端肥大癥、庫欣病、I型糖尿病和艾迪生病)、胃腸病(吸收障礙、維生素C、D缺乏、營養(yǎng)不良和肝功能不全)、慢性阻塞性肺病、戈謝病、貧血和高胱氨酸尿。除軟骨細胞外,成骨細胞在骨生成中也起重要作用。成骨細胞具有激素(PTH、維生素D、雌激素)、細胞因子和生長因子的受體,并且分泌膠原性和非膠原性蛋白。非膠原性蛋白包括細胞粘著蛋白(骨橋蛋白、纖連蛋白、血小板反應蛋白)、鈣結合蛋白(骨粘連蛋白、骨涎蛋白)、參與礦化的蛋白(骨鈣蛋白)、酶(膠原酶和堿性磷酸酶)、生長因子(IGF-1、TGF-B、PDGF)和細胞因子(前列腺素、IL-1、IL-6)。
此外,基質的聚集蛋白聚糖(聚集蛋白聚糖、多功能蛋白聚糖、神經(jīng)蛋白聚糖和短蛋白聚糖)是胞外基質的重要組分。目前已描述的聚集蛋白聚糖和多功能蛋白聚糖的配體-fibulin-1(Aspberg等,J Biol Chem,27420444-9(1999))在發(fā)育中的軟骨和骨中強表達。
另一組癥狀-腎發(fā)育不良和發(fā)育不全,占兒童慢性腎衰竭的20%(Cotran等,Robbins Pathologic Basis of Disease,Saunders,Philadelphia(1994))。先天性腎病可以遺傳,但最常見的是妊娠期間產(chǎn)生的獲得性發(fā)育缺陷。在受影響的個體中,在小鼠中在妊娠8.5天至9天(相當于人類的妊娠第22-24天)時尿生殖區(qū)別明顯。已經(jīng)假定,在發(fā)育期間,發(fā)育不良由異常的細胞分化所致,導致持續(xù)的細胞增殖和可能導致囊腫生成的跨上皮體液分泌(Grantham等(1993)Adv Intern Med 38409-20)或進而影響上皮分化的胞外基質缺陷(Calvet等,J Histochem Cytochem,411223-31(1993))。骨發(fā)育和腎發(fā)育共用的生長因子包括胰島素樣生長因子和BMP。然而,因為鈣/磷和酸/堿失調,所以慢性腎衰竭也可以影響骨生成。
本領域技術人員會認識到,給定的因子可能有效緩解由不相干的病因引起的相似癥狀。因此,給定因子可以用于治療多種疾病。
在可能顯示出緩解病癥能力的因子中,有反義分子、核酶分子和三股螺旋分子。可以設計這類分子,以降低或抑制突變型靶基因活性。產(chǎn)生和使用這類分子的技術是本領域技術人員眾所周知的。
反義RNA和DNA分子的作用是通過與所靶向的mRNA雜交并阻止蛋白翻譯,而直接阻斷mRNA的翻譯。關于反義DNA,最好是源自翻譯起始位點即目的靶基因核苷酸序列的-10和+10區(qū)之間的寡脫氧核糖核苷酸。
核酶是能夠催化RNA特異性切割的酶性RNA分子。核酶的作用機理包括核酶分子與互補靶RNA的序列特異性雜交,然后進行內切核酸酶酶切。核酶分子的組成必須包括與靶基因mRNA互補的一個或多個序列,并且必須包括負責mRNA切割的眾所周知的催化序列。關于這種序列,參見美國專利第5,093,246號,該專利通過引用全部結合到本文中。因此,特異性地有效催化編碼靶基因蛋白的RNA序列的內切核酸酶切割的工程錘頭基序核酶分子屬于本發(fā)明的范圍。
通過掃描目的分子的核酶切割位點(所述核酶切割位點包括以下序列GUA、GUU和GUC),可初步鑒定任何潛在RNA靶內的特異性核酶切割位點。一旦鑒定出,根據(jù)可能使得所述寡核苷酸序列不合適的預測的結構特征,例如二級結構,則可以對與含該切割位點的靶基因區(qū)相應的15-20個核糖核苷酸的短RNA序列進行評估。也可以通過用核糖核酸酶保護測定,測試其與互補寡核苷酸雜交的可及性,評估候選序列的合適性。
待用于形成三股螺旋以抑制轉錄的核酸分子應該是單鏈的,并且由脫氧核糖核苷酸組成。必須對這些寡核苷酸的堿基組成進行設計,以通過Hoogsteen堿基配對原則促進三股螺旋的形成,這一般需要在雙鏈體的一條鏈上存在相當大的或者嘌呤或者嘧啶的序列段。核苷酸序列可以由嘧啶堿基組成的,這將產(chǎn)生跨越所產(chǎn)生的三股螺旋的三條相連鏈的TAT和CGC三聯(lián)體。富含嘧啶的分子提供與雙鏈體一條鏈的富含嘌呤區(qū)的平行方向的堿基互補性。另外,可以選擇富含嘌呤、例如含有G殘基序列段的核酸分子。這些分子將與富含GC對、其中大部分嘌呤殘基位于靶向的雙鏈體的一條鏈上的DNA雙鏈體形成三股螺旋,產(chǎn)生跨越所述三股螺旋的三條鏈的GGC三聯(lián)體。
或者,通過產(chǎn)生所謂的“之字形路線(switchback)”核酸分子,可以增加可以靶向形成三股螺旋的潛在序列。以交替的5’-3’、3’-5’方式合成之字形路線分子,使得它們首先與雙鏈體的一條鏈進行堿基配對,然后與另一條鏈進行堿基配對,消除了對于在雙鏈體的一條鏈上存在或者嘌呤或者嘧啶的相當大的序列段的必要性。
本文所述的反義分子、核酶分子和/或三股螺旋分子有可能降低或抑制由正常和突變型兩種靶基因等位基因產(chǎn)生的mRNA的轉錄(三股螺旋)和/或翻譯(反義、核酶)。為了確保維持基本正常水平的靶基因活性,可以將編碼并表達顯示出正?;钚缘陌谢蚨嚯牡暮怂岱肿?,導入到不含對所利用的反義、核酶或三股螺旋的任一種處理敏感的序列的細胞中?;蛘?,可能最好是將正常的靶基因蛋白共同給予所述細胞或組織,以維持必需水平的細胞或組織靶基因活性。
本發(fā)明的反義RNA和DNA分子、核酶分子和三股螺旋分子可以采用本領域已知用于合成DNA和RNA分子的任何方法來制備。這些包括本領域眾所周知的用于化學合成寡脫氧核糖核苷酸和寡核糖核苷酸的技術,例如固相亞磷酰胺化學合成。或者,可以通過體外和體內轉錄編碼所述反義RNA分子的DNA序列,產(chǎn)生RNA分子??梢詫⑦@類DNA序列加入到各種各樣的加入了合適RNA聚合酶啟動子例如T7或SP6聚合酶啟動子的載體中?;蛘?,可以將根據(jù)所用的啟動子組成型或誘導型合成反義RNA的反義cDNA構建體,穩(wěn)定導入到細胞系中。
可以引入對所述DNA分子的各種熟知的修飾,作為增加胞內穩(wěn)定性和半壽期的手段??赡艿男揎棸ǖ幌抻趯纫砗颂呛塑账峄蛎撗鹾颂呛塑账嵝蛄刑砑拥剿龇肿拥?’端和/或3’端,或在寡脫氧核糖核苷酸骨架中應用硫代磷酸酯鍵合或2’O-甲基鍵合,而不是磷酸二酯鍵。
對靶基因蛋白具有特異性并且干擾其活性的抗體,可以用來抑制靶基因功能。對擴增型靶基因蛋白特異性并且干擾該蛋白的特有相互作用(尤其是可歸因于新獲得與三核苷酸擴增相關功能的功能)的抗體,也可以用來抑制擴增型靶基因功能。尤其感興趣的是針對TRP的擴增型三核苷酸區(qū)的抗體??梢杂脴藴始夹g,產(chǎn)生針對蛋白質本身或針對對應于所述蛋白部分的肽的這類抗體。這類抗體包括但不限于多克隆抗體、單克隆抗體、Fab片段、單鏈抗體、嵌合抗體等。
在所述靶基因蛋白是胞內蛋白并且使用完整抗體的情況下,可以最好使用內化抗體。然而,可以用脂質轉染脂質體將與靶基因表位結合的抗體或Fab區(qū)片段傳遞到細胞中。當使用抗體片段時,最好使用與所述靶蛋白或擴增型靶蛋白的結合結構域結合的最小的抑制性片段。例如,可以使用其氨基酸序列對應于與靶基因蛋白結合的抗體可變區(qū)的結構域的肽。可以化學合成這類肽,或采用本領域眾所周知的方法通過重組DNA技術產(chǎn)生這類肽(參見例如Creighton,ProteinsStructures and Molecular Principles(1984)W.H.Freeman,New York 1983,參見上文;和Sambrook等,1989,參見上文)?;蛘?,也可以給予與胞內靶基因表位結合的單鏈中和抗體。例如,可以采用例如Marasco等,Proc.Natl.Acad.Sci.USA,907889-93(1993)中描述的技術,通過在靶細胞群體內表達編碼單鏈抗體的核苷酸序列,給予這類單鏈抗體。
對所述TRP或擴增型TRP的一個或多個胞外結構域特異性并且干擾其活性的抗體,在治療疾病方面尤其有用。這類抗體尤其有效,因為它們可以直接從血流接近所述靶結構域。下述的適用于肽給予的任何給藥技術,都可以用來有效地將抑制性靶基因抗體給予其作用部位。
可以直接給予表現(xiàn)出病癥的患者編碼靶基因蛋白的RNA序列,其給藥濃度足以產(chǎn)生使得病癥得以緩解的靶基因蛋白水平。
可以通過基因取代療法來治療患者。除將DNA導入細胞中的其它粒子(例如脂質體)外,可以利用包括但不限于腺病毒、腺相關病毒和反轉錄病毒的載體,將指導具有靶基因功能的正常靶基因蛋白產(chǎn)生的正常靶基因或所述基因的一個或多個拷貝,插入到細胞中。另外,例如上述的技術可以用來將正常靶基因序列導入人類細胞中。
可以將含有正常靶基因表達基因序列的細胞,最好是自體細胞,在使得可以緩解病癥的部位導入或再導入所述患者體內。
可以將已鑒定的抑制靶基因表達或擴增型靶基因表達、合成和/或活性的化合物,以治療或緩解所述疾病的治療有效量給予患者。治療有效量是指足以導致病癥緩解的化合物的量。
可以通過標準藥學方法,在細胞培養(yǎng)物或實驗動物體內,測定這類化合物的毒性和治療功效,例如測定LD50(使所述群體的50%致死的劑量)和ED50(在所述群體的50%中治療有效的劑量)。毒性效應和治療效應之間的劑量比是治療指數(shù),它可以以LD50/ED50之比來表示。優(yōu)選顯示出治療指數(shù)大的化合物。雖然可以使用顯示出毒性副作用化合物,但應該小心設計將這類化合物靶向受影響組織的部位的傳遞系統(tǒng),以便最大限度地減小對未感染細胞的潛在損害,從而降低副作用。
由細胞培養(yǎng)物測定和動物研究獲得的數(shù)據(jù),可以用來制定用于人類的劑量范圍。這類化合物的劑量最好在包括在ED50內的毒性很小或無毒的循環(huán)濃度范圍。根據(jù)所用的劑型和所用的給藥途徑,該劑量可以在該范圍內變動。就用于本發(fā)明方法中所用的任何化合物而言,可以根據(jù)細胞培養(yǎng)物測定,初步估計治療有效量。可以在動物模型中確定劑量,以達到包括在細胞培養(yǎng)物中測定的IC50(即達到癥狀的半最大抑制的試驗化合物的濃度)內的循環(huán)血漿濃度范圍。這種信息可以用來更為精確地確定在人體內的有用劑量。例如可以通過高效液相色譜,測量血漿水平。
可以以常規(guī)方式,用一種或多種生理上可接受的載體或賦形劑,配制按照本發(fā)明使用的藥用組合物。因此,可以配制所述化合物及其生理上可接受的鹽和溶劑合物,用于吸入或吹入給藥(或者經(jīng)口或者通過經(jīng)鼻)或經(jīng)口、口腔含化、胃腸外、局部、皮下、腹膜內、靜脈內、胸膜內、眼內、動脈內或直腸給藥。也考慮了藥用組合物可以與增強所述化合物活性的其它制品一起給予,所述藥用組合物可任選地可以包括其它治療組分。
就口服而言,所述藥用組合物可以采用例如以常規(guī)方式用藥學上可接受的賦形劑制備的片劑或膠囊的形式,所述賦形劑例如為粘合劑(例如預膠凝化玉米淀粉、聚乙烯吡咯烷酮或羥丙基甲基纖維素)、填充劑(例如乳糖、微晶纖維素或磷酸氫鈣);潤滑劑(例如硬脂酸鎂、滑石粉或二氧化硅)、崩解劑(例如馬鈴薯淀粉或淀粉甘醇酸鈉)、或潤濕劑(例如十二烷基硫酸鈉)。片劑可以用本領域熟知的方法包衣。用于口服的液體制劑可以采用例如溶液劑、糖漿劑或懸浮劑的形式,或它們可以作為在使用之前用水或其它合適的溶媒重建的干制品??梢杂贸R?guī)方法,用藥學上可接受的添加劑制備這類液體制劑,所述添加劑例如為懸浮劑(例如山梨醇糖漿、纖維素衍生物或氫化食用脂)、乳化劑(例如卵磷脂或阿拉伯樹膠)、非水溶媒(例如杏仁油、油性酯、乙醇或分級植物油)和防腐劑(例如對羥基苯甲酸或山梨酸甲酯或丙酯)。所述制劑合適時也可以含有緩沖鹽、調味劑、著色劑和甜味劑。
可以適當?shù)嘏渲朴糜诳诜闹苿?,以提供所述活性化合物的控釋?br>
對于口腔含化給藥,所述組合物可以采用以常規(guī)方式配制的片劑或錠劑的形式。
對于吸入給藥,應用合適的噴射劑,可方便地從加壓包裝或噴霧器以氣霧劑方式傳遞按照本發(fā)明使用的化合物,所述噴射劑例如為二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合適的氣體。就加壓氣霧劑而論,可以通過提供一個閥以傳遞一個計量量,測定劑量單位。可以配制用于吸入器或吹入器的、含有所述化合物的粉末合劑和合適的粉末基質(例如乳糖或淀粉)的膠囊或藥筒。
可以配制所述化合物,用于通過注射(例如大劑量注射或連續(xù)輸注)胃腸外給藥。注射用制劑可以以單位劑型存在,例如存在于安瓿或多劑量容器中,并加有一種防腐劑。所述組合物可以采用諸如油性或水性溶媒中的懸浮劑、溶液劑或乳劑的形式,可以含有配制用藥劑,例如懸浮劑、穩(wěn)定劑和/或分散劑。或者,有效成分可以為在使用之前用合適溶媒(例如無菌無熱原水)重建的粉末形式。
所述化合物也可以配制為直腸組合物,例如栓劑或保留灌腸劑(retention enemas),例如含有常規(guī)栓劑基質例如可可脂或其它甘油酯。經(jīng)口攝入可能是攝入任何藥物的最容易的方法。這種給藥途徑一般簡單且直接,而且從患者的觀點來看,這通常是不便性或令人不愉快的程度最低的給藥途徑。然而,這涉及到讓所述物質通過胃,而胃對于包括蛋白質和其它生物活性組合物在內的許多物質而言是不利的環(huán)境。由于胃的酸性、水解和蛋白水解環(huán)境已經(jīng)有效地形成,將蛋白性物質消化為氨基酸和寡肽以用于隨后的合成代謝,所以可以意料,非常少的或者各種各樣的生物活性蛋白性物質中的任一種如果是單獨地經(jīng)口攝入,則機體將讓其通過胃以在小腸吸收。其結果是,許多蛋白性藥物必須通過另一種方法攝入,例如通過胃腸外攝入,通常通過皮下、肌內或靜脈內注射。
藥用組合物也可以包括各種緩沖劑(例如Tris、乙酸鹽、磷酸鹽)、增溶劑(例如Tween、聚山梨醇酯)、載體(例如人血清白蛋白)、防腐劑(硫柳汞、苯甲醇)和抗氧化劑(例如抗壞血酸),以便穩(wěn)定藥物活性。穩(wěn)定劑可以是去垢劑,例如吐溫-20、吐溫-80、NP-40或Triton X-100。也可以將EBP加入到特定的聚合化合物制劑中,以便在延長的時間內受控制地傳遞給患者。在Remington’s Pharmaceutical Sciences,第18版,A.R.Gennaro編著,Mack Publishing,Easton,Pa.(1990)中,可找到對藥用組合物的組分更為廣泛的調查。
除前述制劑外,所述化合物也可以配制為緩釋型制劑。這類長效制劑可以通過植入(例如皮下或肌內)或通過肌內注射給藥。因此,例如,可以將所述化合物與合適的聚合物質或疏水性物質(例如作為可接受油中的乳劑)或離子交換樹脂一起配制,或配制為略溶性衍生物,例如配制為略溶性鹽。
如有必要,所述組合物可以存在于包裝或分配裝置(dispenserdevice)中,所述包裝或裝置可以含有含所述有效成分的一個或多個單位劑型。所述包裝可以例如包含金箔或塑料箔,例如泡罩片。所述包裝或分配裝置可以伴有給藥說明。
可以用多種方法診斷與TRP相關的病癥。具體地說,可以使用例如用于檢測靶基因突變存在或檢測靶基因mRNA或者過量表達或者表達不足的試劑。
可以例如通過利用包含至少一種本文所述的特定基因核酸或抗基因抗體試劑的預包裝診斷試劑盒,進行本文所述方法,所述試劑盒可以例如在臨床環(huán)境中方便地用來診斷顯示出病癥或有疾病發(fā)生危險的患者。
在下述的診斷中,可以利用其中表達所述基因的任何細胞類型或組織,最好是單核細胞、內皮細胞或平滑肌細胞。
得自待分析的細胞類型或組織的DNA或RNA可以用本領域技術人員眾所周知的方法,容易地分離出。也可以在從活組織檢查或切除術獲得的患者組織的組織切片(經(jīng)固定和/或冷凍的)上,原位直接進行診斷程序,因此不必進行核酸的純化。核酸試劑可以用作這種原位程序(參見例如Nuovo,PCR In Situ HybridizationProtocols andAppications,Raven Press,N.Y.(1992))的探針和/或引物。
基因的核苷酸序列,或者RNA或者DNA,可以例如用于生物樣品的雜交測定或擴增測定中,以檢測疾病相關的基因結構和表達。這類測定可以包括但不限于DNA印跡分析或RNA印跡分析、限制性片段長度多態(tài)性分析、單鏈構象多態(tài)性分析、原位雜交測定和聚合酶鏈式反應分析。這類分析可以揭示出所述基因表達模式的定量方面以及所基因表達和/或基因組成的定性方面。也就是說,這些方面可以包括例如點突變、插入、缺失、染色體重排和/或所述基因表達的激活或失活。
用于檢測基因特異性核酸分子的優(yōu)選診斷方法可以例如包括使得自所分析細胞類型或組織的核酸與一種或多種標記的核酸試劑在適合于使這些試劑與目的核酸分子內的其互補序列特異性退火的條件下接觸和保溫。最好是,這些核酸試劑的長度至少為9-30個核苷酸。在保溫后,從所述核酸指紋分子雜交體中除去所有未退火的核酸。然后檢測來自所述指紋組織的已經(jīng)雜交的核酸的存在(如果任何這類分子存在的話)。采用這種檢測方案,可以將來自目的組織或細胞類型的核酸固定化至例如固相支持體例如膜或塑料表面,例如固定化至微量滴定板或聚苯乙烯微珠上。在這種情況下,在保溫后,可容易地除去非退火的標記核酸試劑。用本領域技術人員熟知的標準技術,完成保留的、退火的、標記的核酸試劑的檢測。
用于檢測基因特異性核酸分子的可供選擇的診斷方法可以包括其擴增、例如通過PCR擴增(在Mullis的美國專利第4,683,202號(1987)中敘述的實驗實施方案);連接酶鏈式反應(Barany,Proc.Natl.Acad.Sci.USA,88189-93(1991));自身支持性序列擴增(Guatelli等,Proc.Natl.Acad.Sci.USA,871874-78(1990));轉錄擴增系統(tǒng)(Kwoh等,Proc.Natl.Acad.Sci.USA,861173-77(1989))、Q-β復制酶(Lizardi,P.M.等,Bio/Technology,61197(1988)),或任何其它的核酸擴增法;然后用本領域技術人員眾所周知的技術檢測擴增的分子。如果這類分子以非常少的量存在,則這些檢測方案對于核酸分子的檢測尤其有用。
在這種檢測方案的一個實施方案中,從目的RNA分子獲得cDNA分子(例如通過將所述RNA分子反轉錄為cDNA)。從中可以分離出這種RNA的細胞類型或組織,包括其中已知野生型指紋基因表達的任何組織,包括但不限于單核細胞、內皮和/或平滑肌。然后,將所述cDNA內的一段序列用作核酸擴增反應(例如PCR擴增反應等)的模板。在該方法的反轉錄和核酸擴增步驟中用作合成起始試劑(例如引物)的核酸試劑,可以從本文所述的基因核酸試劑中選擇。這類核酸試劑的優(yōu)選長度至少是15-30個核苷酸。對于所擴增產(chǎn)物的檢測,可以用放射性標記或非放射性標記的核苷酸進行核酸擴增?;蛘?,可以制備足夠的擴增產(chǎn)物,使得所述產(chǎn)物可以通過標準的溴化乙錠染色或通過利用任何其它合適的核酸染色法來顯現(xiàn)。
針對野生型、突變型或擴增型基因肽的抗體,也可以用作疾病診斷劑和預后劑。這類診斷方法可以用來檢測基因蛋白表達水平的異常或指紋基因蛋白的結構和/或組織、細胞或亞細胞定位的異常。結構差異可以包括例如相對于正常指紋基因蛋白而言所述突變型指紋基因蛋白大小、電負性或抗原性的差異。
采用本領域技術人員熟知的技術,包括但不限于蛋白質印跡分析,可以容易地檢測或分離出來自待分析組織或細胞類型的蛋白質。有關進行蛋白質印跡分析的方法的詳細解釋,參見Sambrook等(1989)(參見上文),第18章。本文所用的蛋白質檢測和分離方法也可以是例如在例如Harlow和Lane(AntibodiesA LaboratoryManual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York(1988))中描述的那些方法。
用于檢測野生型、突變型或擴增型基因肽分子的優(yōu)選診斷方法可以包括例如免疫測定,其中通過指紋基因肽與抗指紋基因特異性肽抗體的相互作用,來檢測指紋基因肽。
例如,可用于本發(fā)明的抗體或抗體片段,可以用來定量或定性檢測野生型、突變型或擴增型基因肽的存在。這可以通過例如使用熒光標記抗體(參見下文)與光學顯微鏡檢查、流式細胞術檢測或熒光計檢測偶聯(lián)的免疫熒光技術來完成。如果所述指紋基因肽在細胞表面表達,則這類技術尤其有用。
另外,可用于本發(fā)明的抗體(或其片段)可以用于組織學檢測,如用于免疫熒光或免疫電子顯微鏡,用于原位檢測指紋基因肽。原位檢測可以通過從患者體內取出組織學樣本、并在樣本上應用本發(fā)明的標記抗體來完成。所述抗體(或片段)最好是通過將標記抗體(或片段)覆蓋在生物樣品上來應用。通過采用這種方法,有可能不僅檢測所述指紋基因肽的存在,而且有可能檢測其在所檢查組織中的分布。應用本發(fā)明,本領域技術人員將容易地意識到,可以對各種各樣的組織學方法中的任一種(例如染色法)進行修改,以便完成這種原位檢測。
用于野生型、突變型或擴增型指紋基因肽的免疫測定,通常包括將生物樣品(例如生物體液、組織提取物、新收獲的細胞或已經(jīng)在組織培養(yǎng)物中培養(yǎng)的細胞)在能夠鑒定指紋基因肽的可檢測標記的抗體存在下進行保溫,并且通過多種本領域熟知的技術中的任一種檢測結合的抗體。
可以使所述生物樣品與固相支持體或載體(例如硝酸纖維素)或能夠將細胞、細胞粒子或可溶性蛋白固定化的其它固相支持體接觸,并固定化至所述固相支持體或載體上。然后,可以用合適的緩沖液洗滌所述支持體,接著用可檢測標記的基因特異性抗體處理。然后,可以再次用所述緩沖液洗滌固相支持體,以除去未結合的抗體。然后,用常規(guī)方法測定固相支持體上的結合標記的量。
所謂“固相支持體或載體”是指能夠結合抗原或抗體的任何支持體。眾所周知的支持體或載體包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龍、淀粉酶、天然和改性纖維素、聚丙烯酰胺、輝長巖和磁鐵礦。對于本發(fā)明的目的而言,載體的性質可以或者在一定程度上是可溶的或是不溶性的。支持體的材料可以實際上具有任何可能的結構構型,只要所偶聯(lián)的分子能夠與抗原或抗體結合即可。因此,所述支持體的結構可以是球形的(就微珠而論)或圓柱形(如就試管的內表面或棒的外表面而論)?;蛘?,所述表面可以是平坦的,例如片或試紙條等。優(yōu)選的支持體包括聚苯乙烯微珠。本領域技術人員將知道用于結合抗體或抗原的許多其它合適的載體,或者將能夠利用常規(guī)實驗來確定所述載體。
給定的一批抗野生型、抗突變型或抗擴增型指紋基因肽抗體的結合活性,可以按照熟知的方法來測定。本領域技術人員通過使用常規(guī)實驗,將能夠確定操作的最適測定條件。
可以對所述基因肽特異性抗體進行可檢測標記的方法之一是將所述抗體與酶連接,并且將其用于酶免疫測定(EIA)(Voller,Ric ClinLab,8289-98(1978)[“酶聯(lián)免疫吸附測定(ELISA)”,DiagnosticHorizons 21-7,1978,Microbiological Associates Quarterly Publicaiotn,Walkersville,Md.];Voller等,J.Clin.Pathol.,31507-20(1978);Butler,Meth.Enzymol.,73482-523(1981);Maggio(編著),Enzyme Immunoassay,CRC Press,Boca Raton,F(xiàn)la.(1980);Ishikawa等(編著)EnzymeImmunoassay,Igaku-Shoin,Tokyo(1981))。與所述抗體結合的酶將與合適的底物(最好是顯色底物)反應,其反應方式使得產(chǎn)生可以例如通過分光光度計、熒光計或肉眼檢測法檢測的化學部分??梢杂脕砜蓹z測標記所述抗體的酶包括但不限于蘋果酸脫氫酶、葡萄球菌核酸酶、δ-5-類固醇異構酶、酵母乙醇脫氫酶、α-磷酸甘油脫氫酶、磷酸丙糖異構酶、辣根過氧化物酶、堿性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、核糖核酸酶、脲酶、過氧化氫酶、葡萄糖-6-磷酸脫氫酶、葡糖淀粉酶和乙酰膽堿酯酶??梢酝ㄟ^利用所述酶的顯色底物的比色法,完成所述檢測。也可以通過將底物酶反應的程度與同樣制備的標準品進行肉眼比較,完成檢測。
也可以采用多種其它免疫測定中的任一種來完成檢測。例如,通過對所述抗體或抗體片段進行放射性標記,有可能通過利用放射免疫測定(RIA)(參見例如Weintraub,B.,Principles of Radioimmunoassays,Seventh Training Course on Radioligand Assay Techniques,The EndocrineSociety,1986年3月)檢測指紋基因的野生型、突變型或擴增型肽??梢圆捎弥T如應用γ計數(shù)器或閃爍計數(shù)器或通過放射自顯影之類的方法,檢測所述放射性同位素。
也有可能用熒光化合物標記所述抗體。當將所述熒光標記抗體暴露于合適波長的光時,則由于熒光可以檢測到其存在。在最常用的熒光標記化合物中,有異硫氰酸熒光素、羅丹明、藻紅蛋白、藻藍蛋白、別藻藍蛋白、鄰苯二醛和熒光胺。
也可以用發(fā)射熒光的金屬例如152Eu或鑭系的其它金屬,對所述抗體進行可檢測標記??梢杂眠@類金屬螯合基團,例如二亞乙基三胺五乙酸(DTPA)或乙二胺四乙酸(EDTA),將這些金屬與所述抗體連接。
通過將所述抗體與化學發(fā)光化合物偶聯(lián),也可以將其可檢測標記。然后通過檢測在化學反應過程中產(chǎn)生的發(fā)光,檢測所述化學發(fā)光標記的抗體的存在。特別有用的化學發(fā)光標記化合物的實例是魯米諾、異魯米諾、theromatic吖啶鎓酯、咪唑、吖啶鎓鹽和草酸酯。
同樣,可以用生物發(fā)光化合物來標記本發(fā)明的抗體。生物發(fā)光是在生物系統(tǒng)中發(fā)現(xiàn)的一種類型的化學發(fā)光,其中催化性蛋白提高了化學發(fā)光反應的效率。通過檢測發(fā)光的存在,測定生物發(fā)光蛋白的存在。對標記來說,重要的生物發(fā)光化合物是熒光素、熒光素酶和水母發(fā)光蛋白。
在本申請中,用標記的文獻資料出處來表示各種出版物、專利和公布的專利申請。在本申請中提及的這些出版物、專利和公布的專利說明書的公開內容通過引用結合到本說明書中,以更加全面地描述本發(fā)明所屬技術領域的現(xiàn)有技術。
以下實施例僅用來說明本發(fā)明,決不應該解釋為限制本發(fā)明。
實施例實施例1從質粒文庫直接構建構建體使用λZAPTM系統(tǒng),如下制備基因組文庫。讓胚胎干細胞在100mm組織培養(yǎng)板中生長。通過將5ml裂解緩沖液(10mM Tris-HCl pH7.5、10mM EDTA pH8.0、10mM NaCl、0.5%SDS和1mg/ml蛋白酶K)加至100mm平板內匯合的胚胎干細胞中,從這些ES細胞中分離出高分子量基因組DNA。然后將細胞于60℃孵育數(shù)小時或直至完全裂解。通過數(shù)輪溫和的苯酚氯仿抽提和隨后乙醇沉淀,從裂解細胞中純化基因組DNA。
基因組DNA用限制性酶Sau 3AI部分消化,產(chǎn)生約5-20kb的片段。通過添加dATP和dGTP,在Klenow DNA聚合酶存在下將這些片段的末端部分補平,在基因組片段上產(chǎn)生不匹配的末端。然后通過瓊脂糖凝膠電泳(1xTAE,0.8%凝膠),純化5-10kb大小的片段。然后用QIAquick凝膠提取試劑盒(Qiagen,Inc.,Valencia,CA),從切下的瓊脂糖片中分離出所述DNA。
將基因組片段連接到已經(jīng)用Xho I切割并且用dTTP、dCTP和Klenow DNA聚合酶部分補平的λZapTMII載體(Stratagene,Inc.,La Jolla,CA)中。在連接之后,所述DNA用λ包裝混合物(Gigapack III gold,Stratagene,Inc.,La Jolla,CA)包裝,并測定其滴度。
通過讓λ克隆在M13輔助噬菌體ExAssist(Stratagene,Inc.)存在下,在合適的細菌菌株(XL-1 Blue MRF1,Stratagene,Inc.)上生長,從所述λ文庫中得到環(huán)狀噬菌粒DNA。具體地說,將約100,000個λ克隆與全都10-100倍過量的細菌和輔助噬菌體一起于37℃溫育20分鐘。將1ml LB培養(yǎng)基+10mM MgSO4加入到每種切割反應物中,將其于37℃振蕩培養(yǎng)過夜。通常,一次在一個96孔深孔板(block)中建立24-96個這些反應物。第二天早晨,將板加熱至65℃達15分鐘,以殺死細菌和λ噬菌體。通過以約3000g離心15分鐘,除去細菌碎片。保留含有環(huán)狀噬菌粒DNA的上清液,將其直接用于質粒PCR實驗中(關于質粒PCR實驗,參見實施例9和10)。
采用長距離PCR和根據(jù)已知序列(示于圖1中)如上所述選擇的“向外”oligo,在上述噬菌粒DNA庫中篩選特定的目的基因。所述PCR反應物含有2μl的一個庫的噬菌粒DNA樣品、3μl 10×PCR緩沖液3(Boehringer Mannheim)、1.1μl 10mM dNTP、50nM引物、0.3μlEXPAND長模板PCR酶混合物(Long Template PCR Enzyme Mix)(Boehringer-Mannheim)和30μl水。循環(huán)條件是94℃2分鐘(1個循環(huán));94℃10秒、65℃30秒、68℃15秒(15個循環(huán));94℃10秒、60℃30秒、68℃15秒以及于68℃每隔一個循環(huán)增加20秒(25個循環(huán));68℃7分鐘(1個循環(huán))并且于4℃保持。
通過在含有1X TAE緩沖液的瓊脂糖凝膠上電泳,分離所述PCR反應的產(chǎn)物,并且用溴化乙錠和紫外線顯現(xiàn)。從凝膠上切下指示成功的長距離PCR的任何大片段,用QIAquick PCR純化試劑盒(Qiagen)純化。
為了免除對所述PCR片段作限制性圖譜的需要,使用以下不依賴連接作用的克隆策略。用QIAquick PCR純化試劑盒(Qiagen,Inc.,SantaClarita,California)“純化”目的長距離PCR片段。通過混合0.1-2μg所述片段、2μl NEB(New England BioLabs)緩沖液4、1μl 2mM dTTP、6單位T4 DNA聚合酶(NEB)、水至總體積為20μl,并且于25℃保溫30分鐘,產(chǎn)生所述PCR片段的單鏈末端。通過于75℃加熱20分鐘使所述聚合酶失活。用Sac I和Sac II在單一限制性位點消化質粒載體pDG2(示于圖2A中的pDG2),并且如上所述用T4 DNA聚合酶處理每種反應物,也在Neor選擇標記片段上產(chǎn)生單鏈末端。用與長距離PCR片段末端互補的單鏈末端,制備圖1所示的載體。
然后,用或者兩步克隆策略或者四向一步方案,將所述載體和片段裝配為構建體。簡而言之,將含有10ng T4處理的Neor盒、1μl T4處理的PCR片段、0.2μl 0.5M EDTA、0.3μl 0.5M NaCl和水至4μl的反應物加熱至65℃,并且在約45分鐘內讓其冷卻至室溫。然后將所述混合物轉化到亞克隆效能(subcloning efficiency)DH5-α感受態(tài)細胞中。
實施例2從噬菌體文庫產(chǎn)生構建體如下在λ噬菌體中制備小鼠胚胎干細胞文庫。通過在Sau 3AI位點部分切割DNA,產(chǎn)生長度約20kb的基因組片段,從基因組DNA構建基因組文庫。用Klenow酶,在dGTP和dATP存在下,將這些DNA片段的末端序列部分補平,用T4 DNA連接酶將所述片段連接到已經(jīng)用Klenow在dTTP和dCTP存在下部分補平的合適的λ克隆載體例如λFix II(Stratagene,Inc.,La Jolla,California)的Xho I位點中?;蛘?,用蔗糖梯度對所述部分消化的基因組DNA進行大小選擇,并且選擇約20kb的序列。將經(jīng)富集的部分克隆到經(jīng)Bam HI切割的λ載體例如λDatsh II(Stratagene,Inc.,La Jolla,California)中。
將文庫平板接種到1,152個平板上,每個平板含有約1,000個克隆。因此,總共平板接種了1.1×106個克隆(相當于8個基因組)。
通過加入4mlλ洗脫緩沖液(10mM MgCl2、10mM Tris-pH8.0)至每個平板,于室溫溫育3-5小時,從每個平板上洗脫下所述噬菌體。溫育后,從每個平板上收集2ml緩沖液,將其置于96深孔板(Costar,In.)的一個孔中。填充12個96孔板,將其稱為“亞庫文庫(sub-poollibrary)”。
使用該亞庫文庫,通過將100μl的12個不同的亞庫孔內容物置于一個新的96孔板的一個孔中,制備“庫文庫(pool library)。將12個亞庫平板混合形成1個庫文庫平板。
使用已知經(jīng)PCR擴增所述目的基因的一對寡核苷酸,擴增來自“大庫文庫”的96個庫的上清液。在0.5單位的Amplitaq GoldTM(PerkinElmer)、每種寡核苷酸1μM、200μM dNTP、2μl 1-5倍稀釋的所述庫(或亞庫)上清液、50mM KCl、100mM Tris-HCl(pH8.3)以及或者1.5mM或1.25mM MgCl2存在下,進行PCR。循環(huán)條件是95℃8分鐘(1個循環(huán));95℃30秒、60℃30秒、72℃45秒(55個循環(huán));72℃7分鐘(1個循環(huán)),并且于4℃保持。根據(jù)所述基因,約3-12個庫產(chǎn)生如實施例1中所述在瓊脂糖凝膠上鑒定的陽性信號。在需要進一步純化(即在擴增后沒有清晰信號)的情況下,將12個亞庫構成的所述庫,用相同的引物進行擴增,標識為一個亞庫(1000個克隆)。
側翼片段的產(chǎn)生 如上所述,敲除構建體含有與靶基因同源、鄰接正選擇標記的兩個區(qū)段的DNA序列。由如上在實施例2中所述鑒定為陽性的λ克隆的庫,進行長距離PCR。用具有缺乏一種類型堿基的預先確定的序列并且與載體上的預先確定的序列互補的一對寡核苷酸,產(chǎn)生每種片段。所獲得的片段為1-5kb。也用合適的寡核苷酸產(chǎn)生大于5kb的第三片段。然后用這種第三片段獲得待敲除基因附近、但位于所述載體之外的DNA序列。
實施例3兩步克隆法-通用方法pDG2質粒載體(圖2A)含有單一限制性位點Sac II和Sac I。通過用或者限制性酶Sac II或者Sac I消化pDG2載體,并且用T4 DNA聚合酶和dTTP如上所述處理每種反應物,產(chǎn)生合適的單鏈退火位點。對于每種載體,在微量滴定板中建立4種反應物所述反應物含有1μl的或者(1)T4 DNA聚合酶處理的片段;(2)110稀釋的T4處理的片段反應物;(3)1∶100稀釋的T4處理的片段或(4)水(無插入片段對照)。密封所述微量滴定板,將其置于加熱至65℃的兩個溫度塊(temperatureblock)之間,讓其緩慢冷卻至室溫達30-45分鐘。
然后,將微量滴定板置于冰上,向每孔中加入20-25μl亞克隆效能感受態(tài)細胞。將平板于冰上孵育20-30分鐘。然后將微量滴定板置于加熱至42℃的兩個溫度塊之間達2分鐘,然后在冰上放置2分鐘。向每孔中加入100μl LB,用parafilm覆蓋平板,于37℃溫育30-60分鐘。將每孔的全部內容物平板接種到一個LB-Amp平板上,并于37℃溫育過夜。
從所具有的菌落至少是無插入片段對照的2-4倍的平板上,挑出約12-24個菌落。讓所述菌落在深孔板上于37℃生長過夜,然后用Qiagen小量制備試劑盒提取質粒DNA。
用Not I和SalI酶消化質粒DNA。如圖2A所示,Not I/SalI消化將產(chǎn)生一個含有克隆位點3和4的大片段和一個含有克隆位點1和2以及Neor基因的較小的片段。在消化后,將反應物在含有0.2μg/ml溴化乙錠的0.8%瓊脂糖凝膠上電泳。對于無插入片段,存在2個條帶,一個為1975個堿基對,一個為2793個堿基對。當存在插入片段時,這些條帶中的至少一個條帶將較大,因為它會在退火位點1/2或退火位點3/4含有一個片段(插入片段1或2)。切下插入片段條帶,用QIAquick凝膠提取試劑盒處理。進行第二個連接反應,所述反應物含有1μl 10X連接酶緩沖液(50mM Tris-HCl pH7.5、10mM MgCl2、10mM二硫蘇糖醇、1mM ATP、25μg/ml牛血清白蛋白)、1μl T4 DNA連接酶、1-2μl片段(位點3/4條帶)、5μl位點1/2條帶和水至10μl。也用水或者取代位點3/4片段或者取代位點1/2片段,建立對照。將反應物于室溫溫育1-2小時,用25μl感受態(tài)細胞進行轉化。
以下描述適用于下述實施例。許多靶基因的序列是已知的,并且公眾可以得到,主要得自EST數(shù)據(jù)庫。根據(jù)這些序列制備用于PCR擴增靶基因的寡核苷酸引物。這些實施例正文中的“側翼DNA”是指鄰接靶基因中待缺失或突變區(qū)域的基因組序列。“側翼DNA”在上文中也被描述為與靶基因同源的DNA序列區(qū)段。R1基因組文庫是指由R1 ES細胞系制備的基因組文庫。這種文庫例如如實施例1中所述來制備。迄今為止,已經(jīng)在約200個已知的和新的靶基因中實施了本發(fā)明方法。
實施例4用于靶2(一種金屬蛋白酶基因)的打靶構建體的雙向克隆靶2(一種金屬蛋白酶基因)側翼DNA的鑒定。在標準條件下,用Oligo#174(SEQ ID NO19)和#180(SEQ ID NO20),經(jīng)PCR擴增具有一個R1基因組文庫的各個庫,以便鑒定根據(jù)存在500bp條帶指示含有靶#2基因組DNA的各個孔。鑒定出分別含有約12,000個克隆的總共12個庫(庫A5、A7、C2、D2、E5、E10、F7、G1、G7、H2、H4、H7)。然后用oligo 454(SEQ ID NO21)和463(SEQ ID NO22)擴增庫C2,產(chǎn)生一個2000bp的條帶,用oligo 464(SEQ ID NO23)和42(SEQID NO24)擴增庫H2,產(chǎn)生一個2700bp的條帶。這兩個條帶含有靶2的側翼DNA。
打靶構建體的構建。從瓊脂糖凝膠中凝膠純化含有靶2側翼DNA的每個條帶,在dTTP存在下用T4 DNA聚合酶分別處理所述末端,以便產(chǎn)生單鏈突出端。然后將這些條帶中的每個條帶單獨克隆到質粒載體pDG2(示于圖2A中)中。通過不依賴連接作用的克隆,將C2條帶克隆到Sac II消化的、已經(jīng)用T4 DNA聚合酶在dATP存在下處理的pDG2中。在一個單獨的反應中,通過不依賴連接作用的克隆,將H2條帶克隆到Sac I消化的、已經(jīng)用T4 DNA聚合酶在dATP存在下處理的pDG2中。
為了將兩個側翼臂移至一種打靶載體中,用Not I/Sal I消化上述每種載體,凝膠純化含有C2條帶的4kb片段和含有H2條帶的5kb片段。采用標準條件,用T4 DNA連接酶將這兩種片段連接在一起,鑒定含有這兩種側翼臂的重組體。在所檢查的12個菌落中,所有12個菌落都是正確的,即含有正確鄰接正選擇標記Neor的兩個臂。
實施例5用于靶54(一種絲氨酸蛋白酶基因)的打靶構建體的雙向克隆靶54側翼DNA的鑒定。在標準條件下,用Oligo #151(SEQ IDNO25)和#155(SEQ ID NO26),經(jīng)PCR擴增具有一個R1基因組文庫的各個庫,以便鑒定根據(jù)存在179bp條帶指示含有靶#54基因組DNA的各個孔。鑒定出分別含有約12,000個克隆的總共12個庫(庫A4、A10、B2、B9、C9、E1、E6、F8、G4、H6、H7和H9)。然后用oligo454(SEQ ID NO27)和465(SEQ ID NO28)擴增庫G4,產(chǎn)生一個1400bp的條帶,用oligo 466(SEQ ID NO29)和42(SEQ ID NO24)擴增庫H7,產(chǎn)生一個3000bp的條帶。這兩個條帶含有靶54的側翼DNA。
打靶構建體的構建。從瓊脂糖凝膠中凝膠純化每個條帶,在dTTP存在下用T4 DNA聚合酶分別處理所述末端,以便產(chǎn)生單鏈突出端。然后將這些條帶中的每個條帶單獨克隆到pDG2中。通過不依賴連接作用的克隆,將G4條帶克隆到Sac II切割的、已經(jīng)用T4 DNA聚合酶在dATP存在下處理的pDG2中。在一個單獨的反應中,通過不依賴連接作用的克隆,將H7條帶克隆到Sac I切割的、已經(jīng)用T4 DNA聚合酶在dATP存在下處理的pDG2中。
為了將兩個側翼臂移至一種打靶載體中,用Not I/SalI消化上述每種載體,凝膠純化含有G4條帶的6kb片段和含有H7條帶的8kb片段。采用標準條件,用T4 DNA連接酶將這兩種片段連接在一起,鑒定含有這兩種側翼臂的重組體。在所檢查的24個菌落中,14個菌落具有正確的插入片段。
實施例6一步(四向)克隆法-通用方法因為每種單鏈退火位點都是獨一無二的,所以也使用四向連接策略,用一個步驟產(chǎn)生構建體。如上所述建立退火反應,只是每種反應物含有用Sac I和Sac II兩者消化的載體,并且將兩種T4處理的片段都加入到這些反應中。
實施例7用于靶43(一種G蛋白偶聯(lián)受體基因)的打靶構建體的四向克隆靶43側翼DNA的鑒定。在標準條件下,用Oligo#1(SEQ ID NO30)和#2(SEQ ID NO31),經(jīng)PCR擴增具有一個R1基因組文庫的各個庫,以便鑒定根據(jù)存在414bp條帶指示含有靶#43基因組DNA的各個孔。鑒定出分別含有約12,000個克隆的總共11個庫(庫A32、A5、A9、B4、D4、D10、E1、E9、F9、G7和G8)。然后用oligo 41(SEQ ID NO32)和38(SEQ ID NO33)擴增庫E1,產(chǎn)生一個1500bp的條帶,用oligo 40(SEQ ID NO34)和37(SEQ ID NO35)擴增庫D10,產(chǎn)生一個3500bp的條帶。這兩個條帶含有靶43的側翼DNA。
打靶構建體的構建。從瓊脂糖凝膠中凝膠純化每個條帶,在dTTP存在下用T4 DNA聚合酶分別處理所述末端,以便產(chǎn)生單鏈突出端。然后將這些插入片段與約50ng的已經(jīng)用Sac I和Sac II兩者消化、隨后用T4 DNA聚合酶在dATP存在下處理的pDG2混合。將DNA混合物加熱至65℃達2分鐘,然后在冰上孵育5分鐘。然后將退火的DNA轉化到DH5-α感受態(tài)細胞中,通過在氨芐青霉素瓊脂糖平板上進行選擇,獲得重組分子。在于37℃溫育過夜后,挑出單個菌落,讓其生長以用于分析。通過合適的限制性酶消化,鑒定重組分子。在所檢查的52個菌落中,35個菌落具有正確的預期產(chǎn)物的限制圖譜。
實施例8用于靶244(一種新基因)的打靶構建體的四向克隆靶244側翼DNA的鑒定。在標準條件下,用Oligo#540(SEQ IDNO36)和#546(SEQ ID NO37),經(jīng)PCR擴增具有一個R1基因組文庫的各個庫,以便鑒定根據(jù)存在246bp條帶指示含有靶#244基因組DNA的各個孔。鑒定出分別含有約12,000個克隆的總共16個庫(庫A1、B1、A3、A5、A6、B6、A8、C9、D10、E1、F2、E5、E6、F10、G9和H8)。然后用oligo 445(SEQ ID NO38)和667(SEQ ID NO39)擴增庫G9,產(chǎn)生一個1300bp的條帶,用oligo 668(SEQ ID NO40)和42(SEQ ID NO24)擴增庫A6,產(chǎn)生一個1600bp的條帶。這兩個條帶含有靶244的側翼DNA。
打靶構建體的構建。從瓊脂糖凝膠中凝膠純化每個條帶,在dTTP存在下用T4 DNA聚合酶分別處理所述末端,以便產(chǎn)生單鏈突出端。然后將這些插入片段與約50ng的已經(jīng)用Sac I和Sac II兩者消化、隨后用T4 DNA聚合酶在dATP存在下處理的pDG2混合。將DNA混合物加熱至65℃達2分鐘,然后在冰上孵育5分鐘。然后將退火的DNA轉化到DH5-α感受態(tài)細胞中,通過在氨芐青霉素瓊脂糖平板上進行選擇,獲得重組分子。在于37℃溫育過夜后,挑出單個菌落,讓其生長以用于分析。通過合適的限制性酶消化,鑒定重組分子。在所檢查的12個菌落中,2個菌落具有正確的預期產(chǎn)物的限制圖譜。
以下的實施例9和10提供質粒PCR法(在圖1中圖示的)作為上述實施例中所述的雙向和四向策略的替代且優(yōu)選的方法。
實施例9克隆靶227(一種新基因)的打靶構建體的質粒PCR法基因組克隆的擴增由R1 ES細胞,制備在λZap II中克隆并且隨后用M13輔助噬菌體介導的切除進行切除的、一個質粒PCR基因組文庫的各個庫,用oligo 907(SEQ ID NO41)和908(SEQ ID NO42)擴增。這些oligo從所述文庫的庫6擴增了一種約9kb的產(chǎn)物。從瓊脂糖凝膠中分離出這種含有靶227側翼臂以及質粒pBluescript骨架的該片段。
打靶構建體的構建 在dTTP存在下用T4 DNA聚合酶處理所分離的DNA片段,以便產(chǎn)生合適的單鏈末端。然后將該片段與由已經(jīng)用Sac I和Sac II兩者消化、隨后用T4 DNA聚合酶在dATP存在下處理的pDG2獲得的Neor基因片段一起退火(不依賴連接作用)。所述消化和聚合酶處理產(chǎn)生了具有特異性退火至靶277片段的末端的Neor基因。基本上如上所述建立退火反應,獲得靶227構建體(14個克隆中有13個克隆是正確的)。
實施例10克隆靶125(一種核激素受體基因)的打靶構建體的質粒PCR法基因組克隆的擴增 由R1 ES細胞,制備在λZap II中克隆并且隨后用M13輔助噬菌體介導的切除進行切除的、一個質粒PCR文庫的各個庫,用oligo 1157(SEQ ID NO43)和1158(SEQ ID NO44)擴增。這些oligo從所述文庫的庫10擴增了一種約10kb的產(chǎn)物。從瓊脂糖凝膠中分離出這種含有靶125側翼臂以及pBluescript骨架的該片段。
打靶構建體的構建 在dTTP存在下用T4 DNA聚合酶處理所分離的DNA片段,以便產(chǎn)生合適的單鏈末端。然后將該片段與由已經(jīng)用Sac I和Sac II兩者消化、隨后用T4 DNA聚合酶在dATP存在下處理的pDG2獲得的Neor基因片段一起退火。這產(chǎn)生了具有特異性退火至靶125構建體的末端的Neor基因,獲得靶125構建體(18個克隆中有12個克隆是正確的)。
實施例11應用GFP作為篩選標記將GFP(綠色熒光蛋白)基因加入到與靶基因同源區(qū)之外,使得人們可以通過在熒光下篩選ES細胞集落,富集同源重組體(在打靶構建體和ES細胞中的靶基因之間發(fā)生重組)。用胰蛋白酶處理快速生長中的ES細胞,以制備單細胞懸浮液。相應的打靶載體用限制性內切核酸酶線性化,將20μg DNA加入到ES培養(yǎng)基{具有1,000單位/ml LIF(白血病抑制因子-Gibco 13275-029“ESGRO”)和12%胎牛血清的高葡萄糖DMEM(無L-谷氨酰胺或丙酮酸鈉)}中的10×106ES細胞中。將細胞置于2mm間距的樣品池中,在BTX電穿孔裝置上在400μF電阻和200伏下進行電穿孔。在電穿孔后,立即將ES細胞以每個100mm凝膠化組織培養(yǎng)板1×106細胞接種。48小時后,將培養(yǎng)基更換為ES培養(yǎng)基+G418(200μg/ml)。在第4、6和8天,將培養(yǎng)基更換為ES培養(yǎng)基+G418(200μg/ml)。在第10-12天,將平板置于紫外線下,根據(jù)它們是否發(fā)熒光,對ES細胞集落進行評價。該實驗的基礎是發(fā)熒光的細胞已經(jīng)隨機整合了所述打靶載體,并且GFP基因是完整的。已經(jīng)經(jīng)歷了同源重組的細胞會缺失GFP基因,并且不發(fā)熒光;這些是目的克隆。
實施例12靶T243的敲除和純合敲除突變型小鼠的分析靶T243側翼DNA的鑒定 在標準條件下,用Oligo#426(SEQ IDNO55)和#432(SEQ ID NO56),經(jīng)PCR擴增具有一個R1基因組文庫的各個庫,以鑒定根據(jù)存在150bp條帶指示含有靶T243基因組DNA的各個孔。鑒定出分別含有約12,000個克隆的總共48個庫(庫A1、A2、A9、B4、B11、B12、C3、C8、C11、C12、D1、D3、E4、F3、G4、G5、G6、G12、H4、H5和H12)。然后用oligo #488(SEQ ID NO48)[具有單鏈尾序列的引物]和#454(參見圖8)擴增庫H10,產(chǎn)生一個2700bp的條帶。然后用oligo#489(SEQ ID NO49)[具有單鏈尾序列的引物]和#42(參見圖8)擴增庫A7,產(chǎn)生一個5200bp的條帶。這兩個條帶含有靶T243的側翼DNA,(SEQ ID NO50)和(SEQ ID NO51)。
打靶構建體的構建 從瓊脂糖凝膠中凝膠純化每個條帶,在dTTP存在下用T4 DNA聚合酶分別處理所述末端,以便產(chǎn)生單鏈突出端。然后將這些插入片段與約50ng的已經(jīng)用Sac I和Sac II兩者消化、隨后用T4 DNA聚合酶在dATP存在下處理的pDG2混合。將DNA混合物加熱至65℃達2分鐘,然后在冰上孵育5分鐘。將退火的DNA轉化到DH5-α感受態(tài)細胞中,通過在氨芐青霉素瓊脂糖平板上進行選擇,獲得重組分子。在于37℃溫育過夜后,挑出單個菌落,讓其生長以用于分析。通過合適的限制性酶消化,鑒定重組分子。
將打靶構建體導入ES細胞中和同源重組 用胰蛋白酶處理快速生長中的ES細胞,以制備單細胞懸浮液。T243打靶載體用限制性內切核酸酶線性化,將20μg DNA加入到ES培養(yǎng)基{具有1,00單位/mlLIF(白血病抑制因子-Gibco 13275-029“ESGRO”)和12%胎牛血清的高葡萄糖DMEM(無L-谷氨酰胺或丙酮酸鈉)}中的10×106ES細胞中。將細胞置于2mm間距的樣品池中,在BTX電穿孔裝置上在400μF電阻和200伏下進行電穿孔。在電穿孔后,立即將ES細胞以每個100mm凝膠化組織培養(yǎng)板1×106細胞接種。48小時后,將培養(yǎng)基更換為ES培養(yǎng)基+G418(200mg/ml)。在第4、6和8天,將培養(yǎng)基更換為ES培養(yǎng)基+G418(200mg/ml)。
在第10-12天,挑出G418抗性菌落(平均192個菌落),將其以復份置于96孔板中。在ES培養(yǎng)基中培養(yǎng)2-5天后,將一個平板在50%FBS、40%DMEM和10%DMSO中冷凍。讓第二個平板過量生長(overgrow),再飼養(yǎng)8-10天,然后裂解制備供分析用的DNA(裂解緩沖液10mM Tris pH7.5、10mM EDTA pH8.0、10mM NaCl、0.5%Sarcosyl和1mg/ml蛋白酶K)。然后用2倍體積的乙醇沉淀DNA,將其重懸于適宜的緩沖液中。
在證實同源重組事件后,將來自復份平板的陽性孔解凍,置于已經(jīng)接種絲裂霉素C處理的小鼠胚胎成纖維細胞(24小時之前)的24孔組織培養(yǎng)皿中。讓細胞生長至足以供二倍體聚集(CD-1宿主細胞株)和額外的儲存小瓶冷凍用的水平。關于處理ES細胞和由ES細胞產(chǎn)生嵌合小鼠的一般方法,參見Teratocarcinomas and Embryonic Stem CellsAPractical Approach(E.J.Robertson編著,IRL Press,Oxford(1987))。將重團聚胚泡植入假孕雌性CD-1小鼠體內。然后繁育高度嵌合的小鼠,以產(chǎn)生突變型243基因的種系傳遞。
純合T243敲除小鼠的產(chǎn)生和突變表型的分析 繁育雜合T243敲除小鼠,比較純合敲除后代與正常及雜合的同窩小鼠明顯的表型差異。與正常同窩小鼠相比,純合子最初機能亢進,并且皮膚非常干燥。到約15-17天時,純合敲除小鼠開始顯得越來越不穩(wěn)定并且嗜眠;到約19-21天時,純合子顯現(xiàn)出戰(zhàn)栗和瀕臨死亡的體征。在約23-25天,處死未死亡的純合敲除小鼠供進一步分析(參見下文)。
圖9和圖10顯示了每日測量身長和體重的結果、以及在兩只雜合243敲除小鼠之間兩次典型交配后代的體重/身長之比的計算結果。在出生時,純合幼畜的大小與野生型同窩小鼠或雜合同窩小鼠大約相同或略小。然而,隨著年齡的增長,在純合敲除幼畜中體重增加和縱向生長(lengthwise gtowth)均顯著降低。到15-17天時,純合子開始體重減輕,這種體重減輕持續(xù)直至約3周時死亡。
對6只純合突變型小鼠(4只雌性,2只雄性)和3只對照小鼠(2只雌性,1只雄性)進行尸體剖檢。在骨和腎組織中觀察到可歸因于243突變的顯著性差異。
骨 突變型小鼠的軟骨異常,骨生成普遍減少。具體地說,觀察到中軸骨骼和附肢骨骼均縮短。四肢的近端骨和遠端骨成比例縮短,關節(jié)軟骨缺乏愛茜藍染色。
股骨遠端的生長板薄以及骺軟骨薄至缺乏。單突變型小鼠有微小骨折,所述微小骨折從皮質通過干骺端斜線延伸到長骨體生長部中(提示生長板脆性)。在所有突變型小鼠的長骨體生長部內,在增殖和肥大區(qū)中的軟骨細胞柱短。干骺端內軟骨性針狀體短并且間隔寬。偶爾出現(xiàn)的針狀體偶然定向。成骨細胞豐富并且常常沿軟骨性針狀體堆積。骺軟骨薄并且常常被纖維性結締組織所取代。骺表面的愛茜藍染色也減弱。骨骺/長骨體生長部連接處的軟骨略微向外張開,有伸出在長骨體生長部之上的不規(guī)則的凸出邊緣。
發(fā)現(xiàn)突變體的胸骨板不規(guī)則。生長板或者缺乏或者不連續(xù)。大的不規(guī)則的軟骨島延伸到胸骨板體中,偶然有第二個骨化中心。軟骨邊緣向外張開。
根據(jù)愛茜藍染色,椎體不定地骨化。某些椎體小并且主要是軟骨性的,生長板不規(guī)則且薄,顯示出側突漸尖。
腎 所有所述突變型小鼠的兩個腎都有發(fā)育不良改變,這些在皮質髓質連接處最為顯著,而在皮質中程度較低。所述腎小且缺乏正常的結構。皮質薄,并且某些腎小球在被膜下。被膜下的腎小球是小而皺縮、多細胞的腎小球叢,顯示發(fā)育未全。皮質髓質區(qū)沒有放射狀弓形管和獨特的管形。皮質髓質連接處內的腎小管上皮細胞隨機排列成片、堆和簇。某些腎小管上皮細胞小且嗜堿染色暗,因而顯示有再生。
對于本領域技術人員顯而易見的是,在不偏離本發(fā)明精神和范圍的情況下,可以對上述實施方案作各種修飾。這些修飾和變化在本發(fā)明范圍內。
序列表<110>KLEIN,ROBERTMATTHEWS,WILLIAMMOORE,MARKALLEN,KEITH<120>含有TRP基因破壞的轉基因小鼠<130>3866-5<140>未指定<141>2000-10-26<150>US 60/161,488<151>1999-10-26<160>59<170>PatentIn Ver.2.0<210>1<211>4768<212>DNA<213>人工序列<220><223>人工序列的描述pDG2<400>1gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta atacgactca 2460ctaggcggcc gcgtttaaac aatgtgctcc tctttggctt gcttccgcgg gccaagccag 2520acaagaacca gttgacgtca agcttcccgg gacgcgtgct agcggcgcgc cgaattcctg 2580caggattcga gggcccctgc aggtcaattc taccgggtag gggaggcgct tttcccaagg 2640cagtctggag catgcgcttt agcagccccg ctggcacttg gcgctacaca agtggcctct 2700ggcctcgcac acattccaca tccaccggta gcgccaaccg gctccgttct ttggtggccc 2760cttcgcgcca ccttctactc ctcccctagt caggaagttc ccccccgccc cgcagctcgc 2820gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact agtctcgtgc agatggacag 2880caccgctgag caatggaagc gggtaggcct ttggggcagc ggccaatagc agctttgctc 2940cttcgctttc tgggctcaga ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg 3000gctcaggggc ggggcgggcg cgaaggtcct cccgaggccc ggcattctcg cacgcttcaa 3060aagcgcacgt ctgccgcgct gttctcctct tcctcatctc cgggcctttc gacctgcagc 3120caatatggga tcggccattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt 3180ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt 3240gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc 3300cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc 3360ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga 3420agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat 3480ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca 3540agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga 3600tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc 3660gcgcatgccc gacggcgatg atctcgtcgt gacccatggc gatgcctgct tgccgaatat 3720catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga 3780ccgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg 3840ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt 3900ctatcgcctt cttgacgagt tcttctgagg ggatcgatcc gtcctgtaag tctgcagaaa 3960ttgatgatct attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt 4020tgttaagaag ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg 4080gtgggggtgg ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc 4140tttatgataa tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg 4200ccagctcatt cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt 4260tttctcttga ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca 4320tagcctgaag aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt 4380ttgccaagtt ctaattccat cagaagctga ctctagatct ggatccggcc agctaggccg 4440tcgacctcga gtgatcaggt accaaggtcc tcgctctgtg tccgttgagc tcgacgacac 4500aggacacgca aattaattaa ggccggcccg taccctctag tcaaggcctt aagtgagtcg 4560tattacggac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 4620cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 4680accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgctt cgcttggtaa 4740taaagcccgc ttcggcgggc tttttttt4768<210>2<211>6355<212>DNA<213>人工序列<220><223>人工序列的描述pDG4<400>2gtttaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 60acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 120tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 180gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 240acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 300accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 360gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 420ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 480tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 540tgggaggtct atataagcag agctggttta gtgaaccgtc agatccgcta gcgctaccgg 600tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 660agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 720ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 780ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc 840acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 900ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 960acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 1020tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc 1080agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 1140agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1200acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 1260acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1320acaagtccgg actcagatcc accggatcta gataactgat cataatcagc cataccacat 1380ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata 1440aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa 1500gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1560tgtccaaact catcaatgta tcttaacgcg aactacgtca ggtggcactt ttcggggaaa 1620tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 1680gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 1740acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 1800cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 1860catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttc 1920tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc 1980cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 2040accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 2100cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 2160ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 2220accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 2280ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 2340attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 2400ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 2460tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 2520tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 2580gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taccccggtt 2640gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattgtaaac 2700gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa 2760taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agcccgagat agggttgagt 2820gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 2880cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccaa atcaagtttt 2940ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 3000gcttgacggg gaaagcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg 3060ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta 3120atgcgccgct acagggcgcg taaaaggatc taggtgaaga tcctttttga taatctcatg 3180accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 3240aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 3300ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 3360gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta 3420ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 3480ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 3540ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 3600gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg 3660cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 3720cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 3780cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 3840aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 3900taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 3960tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4020ttacgccaag ctacgtaata cgactcacta ggcggccgcg tttaaacaat gtgctcctct 4080ttggcttgct tccgcgggcc aagccagaca agaaccagtt gacgtcaagc ttcccgggac 4140gcgtgctagc ggcgcgccga attcctgcag gattcgaggg cccctgcagg tcaattctac 4200cgggtagggg aggcgctttt cccaaggcag tctggagcat gcgctttagc agccccgctg 4260gcacttggcg ctacacaagt ggcctctggc ctcgcacaca ttccacatcc accggtagcg 4320ccaaccggct ccgttctttg gtggcccctt cgcgccacct tctactcctc ccctagtcag 4380gaagttcccc cccgccccgc agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg 4440tctcactagt ctcgtgcaga tggacagcac cgctgagcaa tggaagcggg taggcctttg 4500gggcagcggc caatagcagc tttgctcctt cgctttctgg gctcagaggc tgggaagggg 4560tgggtccggg ggcgggctca ggggcgggct caggggcggg gcgggcgcga aggtcctccc 4620gaggcccggc attctcgcac gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc 4680tcatctccgg gcctttcgac ctgcagccaa tatgggatcg gccattgaac aagatggatt 4740gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca 4800gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct 4860ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct 4920atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc 4980gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct 5040tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga 5100tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg 5160gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc 5220agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc tcgtcgtgac 5280ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat 5340cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga 5400tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc 5460cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagggga 5520tcgatccgtc ctgtaagtct gcagaaattg atgatctatt aaacaataaa gatgtccact 5580aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag tacctacatt 5640ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat aaatgcctgc 5700tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg gatatcataa 5760tttaaacaag caaaaccaaa ttaagggcca gctcattcct cccactcatg atctatagat 5820ctatagatct ctcgtgggat cattgttttt ctcttgattc ccactttgtg gttctaagta 5880ctgtggtttc caaatgtgtc agtttcatag cctgaagaac gagatcagca gcctctgttc 5940cacatacact tcattctcag tattgttttg ccaagttcta attccatcag aagctgactc 6000tagatctgga tccggccagc taggccgtcg acctcgagtg atcaggtacc aaggtcctcg 6060ctctgtgtcc gttgagctcg acgacacagg acacgcaaat taattaaggc cggcccgtac 6120cctctagtca aggccttaag tgagtcgtat tacggactgg ccgtcgtttt acaacgtcgt 6180gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 6240agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 6300aatggcgaat ggcgcttcgc ttggtaataa agcccgcttc ggcgggcttt ttttt 6355<210>3<211>26<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>3tgtgctcctc tttggcttgc ttccaa 26<210>4<211>26<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>4ttggaagcaa gccaaagagg agcaca 26<210>5<211>24<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>5ctggttcttg tctggcttgc ccaa24<210>6<211>25<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>6ttgggccaag ccagacaaga accag 25<210>7<211>24<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>7ggtcctcgct ctgtgtccgt tgaa24<210>8<211>24<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>8ttcaacggac acagagcgag gacc 24<210>9<211>23<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>9tttgcgtgtc ctgtgtcgtc gaa23<210>10<211>23<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>10ttcgacgaca caggacacgc aaa23<210>11<211>28<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>11aatgtgctcc tctttggctt gcttccgc 28<210>12<211>26<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>12ggaagcaagc caaagaggag cacatt 26<210>13<211>27<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>13aactggttct tgtctggctt ggcccgc27<210>14<211>25<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>14gggccaagcc agacaagaac cagtt 25<210>15<211>28<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>15aaggtcctcg ctctgtgtcc gttgagct28<210>16<211>24<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>16caacggacac agagcgagga cctt24<210>17<211>27<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>17aatttgcgtg tcctgtgtcg tcgagct 27<210>18<211>23<212>DNA<213>人工序列<220><223>人工序列的描述退火序列<400>18cgacgacaca ggacacgcaa att 23<210>19<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>19atgaccgctc aggaaacctg ttgca 25<210>20<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>20ataggcatag taggccagct tgagg 25<210>21<211>51<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>21tgtgctcctc tttggcttgc ttccaattaa ccctcactaa agggaacgaa t 51<210>22<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>22ctggttcttg tctggcttgg cccaatgcaa caggtttcct gagcggtcat50<210>23<211>49<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>23ggtcctcgct ctgtgtccgt tgaacctcaa gctggcctac tatgcctat 49<210>24<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>24tttgcgtgtc ctgtgtcgtc gaacgactaa atacgactca ctatagggcg50<210>25<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>25gccaatggac tcttagtttt ggaac 25<210>26<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>26gttctggcaa acaaattcgg cgcac 25<210>27<211>51<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>27tgtgctcctc tttggcttgc ttccaattaa ccctcactaa agggaacgaa t 51<210>28<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>28ctggttcttg tctggcttgg cccaagttcc aaaactaaga gtccattggc50<210>29<211>49<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>29ggtcctcgct ctgtgtccgt tgaagtgcgc cgaatttgtt tgccagaac 49<210>30<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>30gaaccttggt gtgccaagtt acttc 25<210>31<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>31gaactttggc tgaacccctt gttct 25<210>32<211>53<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>32tgtgctcctc tttggcttgc gttgaacgac taatacggac tcactatagg gcg53<210>33<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>33ctggttcttg tctggcttgg cccaagaagt aacttggcac accaaggttc50<210>34<211>48<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>34ggtcctcgct ctgtgtccgt tgaagaacaa ggggttcagc caaagttc 48<210>35<211>48<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>35tttgcgtgtc ctgtgtcgtc gaattaaccc tcactaaagg gaacgaat 48<210>36<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>36atgccggatc tcctactact gggcc 25<210>37<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>37tgtcatagta gacagcgatg gaacg 25<210>38<211>53<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>38gacaagaacc agttgacgtc aagcttcccg ggacgcgtgc tagcggcgcg ccg53<210>39<211>49<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>39ctggtcttgt ctggcttggc ccaaggccca gtagtaggag atccggcat 49<210>40<211>49<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>40ggtcctcgct ctgtgtccgt tgaacgttcc atcgctgtct actatgaca 49<210>41<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>41ctggttcttg tctggcttgg cccaaaaagc cgacagccac gctcacaagc50<210>42<211>49<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>42ggtcctcgct ctgtgtccgt tgaagcccaa tgccacagag agagaatgt 49<210>43<211>51<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>43ctggttcttg tctggcttgg cccaagttgg atcctctcca aggccccatc t 51<210>44<211>50<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>44ggtcctcgct ctgtgtccgt tgaactccag tgccgagtgt gtggggacag50<210>45<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>45agctcagaca tggactccat ggccc 25<210>46<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>46tgcgattgcc cagcaaatgc gaagt 25<210>47<211>1839<212>DNA<213>鼠類TRP<400>47ggcacgaggg aggaagcgcc gccgggtccg ctctgctctg ggtccggctg ggccatggag 60tccatgtctg agctcgcgcc ccgctgcctc ttatttcctt tgctgctgct gcttccgctg 120ctgctccttc ctgccccgaa gctaggcccg agtcccgccg gggctgagga gaccgactgg 180gtgcgattgc ccagcaaatg cgaagtgtgc aagtatgttg ctgtggagct gaagtcggct 240tttgaggaaa cgggaaagac caaggaagtg attgacaccg gctatggcat cctggacggg 300aagggctctg gagtcaagta caccaagtcg gacttacggt taattgaagt cactgagacc 360atttgcaaga ggcttctgga ctacagcctg cacaaggaga ggactggcag caaccggttt 420gccaagggta tgtcggagac ctttgagacg ctgcacaacc tagtccacaa aggggtcaag 480gtggtgatgg atatccccta tgagctgtgg aacgagacct cagcagaggt ggctgacctc 540aagaagcagt gtgacgtgct ggtggaagag tttgaagagg tgattgagga ctggtacagg 600aaccaccagg aggaagacct gactgaattc ctctgtgcca accacgtgct gaagggaaag 660gacacgagtt gcctagcaga gcggtggtct ggcaagaagg gggacatagc ctccctggga 720gggaagaaat ccaagaagaa gcgcagcgga gtcaagggct cctccagtgg cagcagcaag 780cagaggaagg aactgggggg cctgggggag gatgccaacg ccgaggagga ggagggtgtg 840cagaaggcat cgcccctccc acacagcccc cctgatgagc tgtgagccca gcttagtgtc 900cttgaatcaa gacccctgac ttcagagctt gggacacgca cagcgcagcg cagcgcagct 960ccagcaagga cagctgctgt ccagcatcag gtctcctccc ttggctgtgc ccctttcctt 1020cccttgaaca acagcaagag gtggaaggat ctggggtgct gggagacggc accccaaagg 1080gaagaggagg aggagcagaa ggcagctctc tttctacaca gtccccctca cgagctccgg 1140ggtccaccca gcatccccag gctgagatcc aggctcctga catggaagct gaagagcatg 1200aggcacataa gatgctcacc agcgccccct tcagccagga aggactccgt gcagcctcag 1260cagccaggcc tgcctcttcc ttccaccaag cattctcttc tgctggtcct tgtcggatgg 1320taaattcgag aacttccagg acaaactcgg gtgtggcaca aaggggctgg acgccagagc 1380cagagccacg ccagagactg cagagagggc acctgaccta acccccctgg aaagccaatc 1440tgcagttccc gtgtccaccc actcctcctg aggacgcctc atgctctgcc cagcccttct 1500cccagggcta ccagagtaaa caccttttgg cctttcggtt tggttcctgg gtcctcatca 1560gcctccagag tgtcccctca tcgatctttt ttgcctttgt cccccaatcc caggggctgg 1620aaggccatca ccatcattgg aggcttaacc tgtcagttac taggaggtgc tgggagcgcc 1680cggggttggt ttggggtaat cactcactgg ctctcagcct tctaacactg cagcccctta 1740atacagttcc ttctgttgtg gtgactccca cgcccccaca cacacaccat aaaattattt 1800cgatgctgtt tcataactgt aaaaaaaaaa aaaaaaaaa1839<210>48<211>49<212>DNA<213>人工序列<220><223>人工序列的描述帶有克隆位點的引物<400>48ctggttcttg tcggcttggc ccaaagctca gacatggact ccatggccc 49<210>49<211>49<212>DNA<213>人工序列<220><223>人工序列的描述帶有克隆位點的引物<400>49ggtcctcgct ctgtgtccgt tgaatgcgat tgcccagcaa atgcgaagt 49<210>50<211>471<212>DNA<213>T243的同源物<220><221>經(jīng)修飾的堿基<222>(260)<223>A、T、G或C<400>50acagaaaaca agaaacaaaa accatgaaag atagtctgtt atccagggct agaatgccca 60aggctggttc atccaaggta tgatgaaggt tcacccgcta ggaactgatg ctccagctac 120tgagcctcct ttagctggca gtgatatcgc tatagggcgc caaagccacc atccgctctc 180tgattgggtg agatgggaaa aaaaaaagat agttcctctc attggctata aagcagacgc 240cgagcgaacc cattggttgn gtcgcccgcg ggccttggtc ggtttcgcaa gccgctagag 300gctaccgggc gaggggcggg ccggagctcg ccgttgccgt ggttacccag agacacgtgc 360gcagtcccgg aagcggccgg gggaagctgc tccgcgcgcg ctgccggagg aagcgccgcc 420gggtccgctc tgctctgggt ccggctgggc catggagtcc atgtctgagc t 471<210>51<211>370<212>DNA<213>T243的同源物<400>51tgcgattgcc cagcaaatgc gaaggtgagg gggcggggcc gcggggcgta gccaagcccg 60aggggcggga gggggcgggg cctgtgggaa gggtctgggc ctggcaggac ctgggctggg 120gtctccttgg ccctgctgtg tgctttgcgg caatgctggg tgctgtgact ctcggataac 180ctggagatcc ctgcttttgg gcgaatccgg gggtagttgc tcatcaagac tagaggtggg 240ggtggaggga aggcttcata caggaagcct gctgcgaaat gaagagttgg ccagggaaag 300catggcgtgc agaggaactc actccgcaga aaccacagaa acagaggcag atgaggacgc 360cctgccggcc370<210>52<211>276<212>PRT<213>鼠類TRP<400>52Met Glu Ser Met Ser Glu Leu Ala Pro Arg Cys Leu Leu Phe Pro Leu1 5 10 15Leu Leu Leu Leu Pro Leu Leu Leu Leu Pro Ala Pro Lys Leu Gly Pro
20 25 30Ser Pro Ala Gly Ala Glu Glu Thr Asp Trp Val Arg Leu Pro Ser Lys35 40 45Cys Glu Val Cys Lys Tyr Val Ala Val Glu Leu Lys Ser Ala Phe Glu50 55 60Glu Thr Gly Lys Thr Lys Glu Val Ile Asp Thr Gly Tyr Gly Ile Leu65 70 75 80Asp Gly Lys Gly Ser Gly Val Lys Tyr Thr Lys Ser Asp Leu Arg Leu85 90 95Ile Glu Val Thr Glu Thr Ile Cys Lys Arg Leu Leu Asp Tyr Ser Leu100 105 110His Lys Glu Arg Thr Gly Ser Asn Arg Phe Ala Lys Gly Met Ser Glu115 120 125Thr Phe Glu Thr Leu His Asn Leu Val His Lys Gly Val Lys Val Val130 135 140Met Asp Ile Pro Tyr Glu Leu Trp Asn Glu Thr Ser Ala Glu Val Ala145 150 155 160Asp Leu Lys Lys Gln Cys Asp Val Leu Val Glu Glu Phe Glu Glu Val165 170 175Ile Glu Asp Trp Tyr Arg Asn His Gln Glu Glu Asp Leu Thr Glu Phe180 185 190Leu Cys Ala Asn His Val Leu Lys Gly Lys Asp Thr Ser Cys Leu Ala195 200 205Glu Arg Trp Ser Gly Lys Lys Gly Asp Ile Ala Ser Leu Gly Gly Lys210 215 220Lys Ser Lys Lys Lys Arg Ser Gly Val Lys Gly Ser Ser Ser Gly Ser225 230 235 240Ser Lys Gln Arg Lys Glu Leu Gly Gly Leu Gly Glu Asp Ala Asn Ala245 250 255Glu Glu Glu Glu Gly Val Gln Lys Ala Ser Pro Leu Pro His Ser Pro260 265 270Pro Asp Glu Leu
275<210>53<211>1848<212>DNA<213>擴增型T243<400>53ggcacgaggg aggaagcgcc gccgggtccg ctctgctctg ggtccggctg ggccatggag 60tccatgtctg agctgctgct gctgctgctg ctgctgctgc tgctgctgct gctgctgctg 120ctgctgctgc tgctgctgct gctgctgctg ctgctgctgc tgctgctgct gctgctgctg 180ctgctgctgc tgcgattgcc cagcaaatgc gaagtgtgca agtatgttgc tgtggagctg 240aagtcggctt ttgaggaaac gggaaagacc aaggaagtga ttgacaccgg ctatggcatc 300ctggacggga agggctctgg agtcaagtac accaagtcgg acttacggtt aattgaagtc 360actgagacca tttgcaagag gcttctggac tacagcctgc acaaggagag gactggcagc 420aaccggtttg ccaagggtat gtcggagacc tttgagacgc tgcacaacct agtccacaaa 480ggggtcaagg tggtgatgga tatcccctat gagctgtgga acgagacctc agcagaggtg 540gctgacctca agaagcagtg tgacgtgctg gtggaagagt ttgaagaggt gattgaggac 600tggtacagga accaccagga ggaagacctg actgaattcc tctgtgccaa ccacgtgctg 660aagggaaagg acacgagttg cctagcagag cggtggtctg gcaagaaggg ggacatagcc 720tccctgggag ggaagaaatc caagaagaag cgcagcggag tcaagggctc ctccagtggc 780agcagcaagc agaggaagga actggggggc ctgggggagg atgccaacgc cgaggaggag 840gagggtgtgc agaaggcatc gcccctccca cacagccccc ctgatgagct gtgagcccag 900cttagtgtcc ttgaatcaag acccctgact tcagagcttg ggacacgcac agcgcagcgc 960agcgcagctc cagcaaggac agctgctgtc cagcatcagg tctcctccct tggctgtgcc 1020cctttccttc ccttgaacaa cagcaagagg tggaaggatc tggggtgctg ggagacggca 1080ccccaaaggg aagaggagga ggagcagaag gcagctctct ttctacacag tccccctcac 1140gagctccggg gtccacccag catccccagg ctgagatcca ggctcctgac atggaagctg 1200aagagcatga ggcacataag atgctcacca gcgccccctt cagccaggaa ggactccgtg 1260cagcctcagc agccaggcct gcctcttcct tccaccaagc attctcttct gctggtcctt 1320gtcggatggt aaattcgaga acttccagga caaactcggg tgtggcacaa aggggctgga 1380cgccagagcc agagccacgc cagagactgc agagagggca cctgacctaa cccccctgga 1440aagccaatct gcagttcccg tgtccaccca ctcctcctga ggacgcctca tgctctgccc 1500agcccttctc ccagggctac cagagtaaac accttttggc ctttcggttt ggttcctggg 1560tcctcatcag cctccagagt gtcccctcat cgatcttttt tgcctttgtc ccccaatccc 1620aggggctgga aggccatcac catcattgga ggcttaacct gtcagttact aggaggtgct 1680gggagcgccc ggggttggtt tggggtaatc actcactggc tctcagcctt ctaacactgc 1740agccccttaa tacagttcct tctgttgtgg tgactcccac gcccccacac acacaccata 1800aaattatttc gatgctgttt cataactgta aaaaaaaaaa aaaaaaaa 1848<210>54<211>279<212>PRT<213>擴增型T243<400>54Met Glu Ser Met Ser Glu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu1 5 10 15Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu20 25 30Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Arg Leu35 40 45Pro Ser Lys Cys Glu Val Cys Lys Tyr Val Ala Val Glu Leu Lys Ser50 55 60Ala Phe Glu Glu Thr Gly Lys Thr Lys Glu Val Ile Asp Thr Gly Tyr65 70 75 80Gly Ile Leu Asp Gly Lys Gly Ser Gly Val Lys Tyr Thr Lys Ser Asp85 90 95Leu Arg Leu Ile Glu Val Thr Glu Thr Ile Cys Lys Arg Leu Leu Asp100 105 110Tyr Ser Leu His Lys Glu Arg Thr Gly Ser Asn Arg Phe Ala Lys Gly115 120 125Met Ser Glu Thr Phe Glu Thr Leu His Asn Leu Val His Lys Gly Val130 135 140Lys Val Val Met Asp Ile Pro Tyr Glu Leu Trp Asn Glu Thr Ser Ala145 150 155 160Glu Val Ala Asp Leu Lys Lys Gln Cys Asp Val Leu Val Glu Glu Phe165 170 175Glu Glu Val Ile Glu Asp Trp Tyr Arg Asn His Gln Glu Glu Asp Leu180 185 190Thr Glu Phe Leu Cys Ala Asn His Val Leu Lys Gly Lys Asp Thr Ser195 200 205Cys Leu Ala Glu Arg Trp Ser Gly Lys Lys Gly Asp Ile Ala Ser Leu210 215 220Gly Gly Lys Lys Ser Lys Lys Lys Arg Ser Gly Val Lys Gly Ser Ser225 230 235 240Ser Gly Ser Ser Lys Gln Arg Lys Glu Leu Gly Gly Leu Gly Glu Asp245 250 255Ala Asn Ala Glu Glu Glu Glu Gly Val Gln Lys Ala Ser Pro Leu Pro
260 265 270His Ser Pro Pro Asp Glu Leu275<210>55<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>55gggccatgga gtccatgtct gagct 25<210>56<211>25<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>56acttcgcatt tgctgggcaa tcgca 25<210>57<211>1362<212>DNA<213>人類TRP<400>57cgagccatgg attcaatgcc tgagcccgcg tcccgctgtc ttctgcttct tcccttgctg 60ctgctgctgc tgctgctgct gccggccccg gagctgggcc cgagccaggc cggagctgag 120gagaacgact gggttcgcct gcccagcaaa tgcgaagtgt gtaaatatgt tgctgtggag 180ctgaagtcag cctttgagga aaccggcaag accaaggagg tgattggcac gggctatggc 240atcctggacc agaaggcctc tggagtcaaa tacaccaagt cggacttgcg gttaatcgaa 300gtcactgaga ccatttgcaa gaggctcctg gattatagcc tgcacaagga gaggaccggc 360agcaatcgat ttgccaaggg catgtcagag acctttgaga cattacacaa cctggtacac 420aaaggggtca aggtggtgat ggacatcccc tatgagctgt ggaacgagac ttctgcagag 480gtggctgacc tcaagaagca gtgtgatgtg ctggtggaag agtttgagga ggtgatcgag 540gactggtaca ggaaccacca ggaggaagac ctgactgaat tcctctgcgc caaccacgtg 600ctgaagggaa aagacaccag ttgcctggca gagcagtggt ccggcaagaa gggagacaca 660gctgccctgg gagggaagaa gtccaagaag aagagcagca gggccaaggc agcaggcggc 720aggagtagca gcagcaaaca aaggaaggag ctgggtggcc ttgagggaga ccccagcccc 780gaggaggatg agggcatcca gaaggcatcc cctctcacac acagcccccc tgatgagctc 840tgagcccacc cagcatcctc tgtcctgaga cccctgattt tgaagctgag gagtcagggg 900catggctctg gcaggccggg atggccccgc agccttcagc ccctccttgc cttggctgtg 960ccctcttctg ccaaggaaag acacaagccc caggaagaac tcagagccgt catgggtagc 1020ccacgccgtc ctttcccctc cccaagtgtt tctctcctga cccagggttc aggcaggcct 1080tgtggtttca ggactgcaag gactccagtg tgaactcagg aggggcaggt gtcagaactg 1140ggcaccagga ctggagcccc ctccggagac caaactcacc atccctcagt cctccccaac 1200agggtactag gactgcagcc ccctgtagct cctctctgct tacccctcct gtggacacct 1260tgcactctgc ctggcccttc ccagagccca aagagtaaaa atgttctggt tctgaaaaaa 1320aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa1362<210>58<211>278<212>PRT<213>人類TRP<400>58Met Asp Ser Met Pro Glu Pro Ala Ser Arg Cys Leu Leu Leu Leu Pro1 5 10 15Leu Leu Leu Leu Leu Leu Leu Leu Leu Pro Ala Pro Glu Leu Gly Pro20 25 30Ser Gln Ala Gly Ala Glu Glu Asn Asp Trp Val Arg Leu Pro Ser Lys35 40 45Cys Glu Val Cys Lys Tyr Val Ala Val Glu Leu Lys Ser Ala Phe Glu50 55 60Glu Thr Gly Lys Thr Lys Glu Val Ile Gly Thr Gly Tyr Gly Ile Leu65 70 75 80Asp Gln Lys Ala Ser Gly Val Lys Tyr Thr Lys Ser Asp Leu Arg Leu85 90 95Ile Glu Val Thr Glu Thr Ile Cys Lys Arg Leu Leu Asp Tyr Ser Leu100 105 110His Lys Glu Arg Thr Gly Ser Asn Arg Phe Ala Lys Gly Met Ser Glu115 120 125Thr Phe Glu Thr Leu His Asn Leu Val His Lys Gly Val Lys Val Val130 135 140Met Asp Ile Pro Tyr Glu Leu Trp Asn Glu Thr Ser Ala Glu Val Ala145 150 155 160Asp Leu Lys Lys Gln Cys Asp Val Leu Val Glu Glu Phe Glu Glu Val165 170 175Ile Glu Asp Trp Tyr Arg Asn His Gln Glu Glu Asp Leu Thr Glu Phe180 185 190Leu Cys Ala Asn His Val Leu Lys Gly Lys Asp Thr Ser Cys Leu Ala195 200 205Glu Gln Trp Ser Gly Lys Lys Gly Asp Thr Ala Ala Leu Gly Gly Lys210 215 220Lys Ser Lys Lys Lys Ser Ser Arg Ala Lys Ala Ala Gly Gly Arg Ser225 230 235 240Ser Ser Ser Lys Gln Arg Lys Glu Leu Gly Gly Leu Glu Gly Asp Pro245 250 255Ser Pro Glu Glu Asp Glu Gly Ile Gln Lys Ala Ser Pro Leu Thr His260 265 270Ser Pro Pro Asp Glu Leu275<210>59<211>107<212>DNA<213>通過敲除產(chǎn)生的缺失<400>59cgcgccccgc tgcctcttat ttcctttgct gctgctgctt ccgctgctgc tccttcctgc 60cccgaagcta ggcccgagtc ccgccggggc tgaggagacc gactggg 10權利要求
1.一種細胞,所述細胞在編碼TRP的靶DNA序列中包含破壞。
2.權利要求1的細胞,其中所述破壞用以下方法產(chǎn)生,所述方法包括(a)獲得與所述靶DNA序列的第一區(qū)同源的第一序列;(b)獲得與所述靶DNA序列的第二區(qū)同源的第二序列;(c)將所述第一序列和所述第二序列插入到打靶構建體中;和(d)將所述打靶構建體導入所述細胞中,產(chǎn)生在所述靶DNA序列中產(chǎn)生破壞的同源重組體。
3.權利要求2的細胞,其中所述方法還包括在步驟(b)之后;(i)提供一種載體,所述載體具有編碼正選擇標記的基因;和(ii)利用不依賴連接作用的克隆,將所述第一序列和所述第二序列插入所述載體中,構成所述構建體;其中所述正選擇標記位于所述構建體中所述第一序列和所述第二序列之間。
4.權利要求3的細胞,其中所述載體還包含一個編碼篩選標記的基因。
5.權利要求1的細胞,其中所述靶DNA序列包含CTG三核苷酸重復。
6.權利要求5的細胞,其中所述CTG三核苷酸重復編碼亮氨酸殘基。
7.權利要求1的細胞,其中所述靶基因序列是T243或其天然存在的等位基因變異體。
8.權利要求1的細胞,其中所述靶DNA序列包含SEQ IDNO47。
9.權利要求1的細胞,其中所述靶DNA序列包含SEQ ID NO45和SEQ ID NO46。
10.權利要求3的細胞,其中所述載體還包含鄰接所述正選擇標記的一個或多個重組酶靶位點。
11.權利要求2的細胞,其中所述第一序列是SEQ ID NO50,而所述第二序列是SEQ ID NO51。
12.權利要求2的細胞,其中所述第一序列和所述第二序列用以下方法獲得,所述方法包括(a)獲得能夠與所述靶雜交的兩種引物,其中所述引物形成擴增產(chǎn)物的終點;(b)提供含有所述靶序列的小鼠基因組DNA文庫;(c)使所述引物退火至所述文庫中的互補序列上;(d)擴增所述第一序列和所述第二序列;和(e)分離所述擴增反應的產(chǎn)物。
13.權利要求12的細胞,其中所述第一引物是SEQ ID NO45。
14.權利要求12的細胞,其中所述第二引物是SEQ ID NO46。
15.權利要求12的細胞,其中所述擴增包括PCR。
16.權利要求15的細胞,其中所述擴增還包括長距離PCR。
17.權利要求12的細胞,其中所述小鼠基因組文庫是一種質粒文庫。
18.權利要求12的細胞,其中所述小鼠基因組文庫是一種噬菌體文庫,所述方法還包括獲得能夠與噬菌體載體序列雜交的兩種引物,使得所述擴增產(chǎn)物在一個末端以一種靶序列引物終止,而在另一個末端以一種載體引物終止。
19.權利要求1的細胞,其中所述細胞在所述靶DNA序列中包含純合破壞。
20.權利要求1的細胞,其中所述細胞是鼠類細胞。
21.權利要求1的細胞,其中所述細胞是人類細胞。
22.權利要求1的細胞,其中所述細胞是干細胞。
23.權利要求22的干細胞,其中所述干細胞是胚胎干細胞。
24.一種胚泡,所述胚泡含有權利要求23的胚胎干細胞。
25.打靶構建體,所述打靶構建體是在權利要求2的方法中使用的打靶構建體。
26.一種非人類脊椎動物,所述脊椎動物在編碼TRP的基因中包含雜合破壞。
27.權利要求26的脊椎動物,其中所述脊椎動物是一種哺乳動物。
28.權利要求26的脊椎動物,其中所述哺乳動物是小鼠。
29.權利要求28的小鼠,其中所述小鼠用以下方法產(chǎn)生,所述方法包括(a)將權利要求1或權利要求2的干細胞引入胚泡中;(b)將所得的胚泡植入假孕小鼠體內,其中所述假孕小鼠分娩出在其種系中含有被破壞的編碼所述TRP的基因的嵌合小鼠;和(c)繁育所述嵌合小鼠,以產(chǎn)生在編碼所述TRP的基因中包含雜合破壞的小鼠。
30.權利要求28的小鼠,其中所述小鼠用以下方法產(chǎn)生,所述方法包括(a)將權利要求3的干細胞引入胚泡中;(b)將所得的胚泡植入假孕小鼠體內,其中所述假孕小鼠分娩出在其種系中含有被破壞的編碼所述TRP的基因的嵌合小鼠;和(c)繁育所述嵌合小鼠,以產(chǎn)生在編碼所述TRP的基因中包含雜合破壞的小鼠。
31.權利要求28的小鼠,其中所述TRP由T243或其天然存在的等位基因變異體編碼。
32.一種敲除小鼠,所述敲除小鼠在編碼TRP的基因中包含一個純合破壞,其中所述破壞抑制所述野生型TRP的產(chǎn)生,所述小鼠通過使權利要求28的兩只小鼠交配而產(chǎn)生。
33.權利要求32的敲除小鼠,其中所述破壞改變了TRP基因啟動子、增強子或剪接位點,使得所述小鼠不表達功能型TRP。
34.權利要求32的敲除小鼠,其中所述破壞是插入突變、錯義突變、移碼突變或缺失突變。
35.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括相對于野生型成年小鼠而言體重降低。
36.權利要求35的敲除小鼠,其中所述表型還包括相對于野生型成年小鼠而言體重降低至少約15%。
37.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括相對于野生型成年小鼠而言身長降低。
38.權利要求37的敲除小鼠,其中所述表型還包括相對于野生型成年小鼠而言身長降低至少約10%。
39.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括相對于野生型成年小鼠而言體重與身長之比降低。
40.權利要求39的敲除小鼠,其中所述表型還包括相對于正常的野生型成年小鼠而言體重與身長之比降低至少約20%。
41.權利要求32的敲除小鼠,其中相對于野生型成年小鼠而言,所述成年小鼠的表型包括(a)體重降低;(b)身長降低;和(c)體重與身長之比降低。
42.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括與軟骨病相關的癥狀。
43.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括與骨病相關的癥狀。
44.權利要求32的敲除小鼠,其中所述成年小鼠的表型包括與腎病相關的癥狀。
45.權利要求41的敲除小鼠,其中所述表型在出生時不明顯。
46.一種細胞或細胞系,所述細胞或細胞系來源于權利要求28或權利要求32的含有所述破壞的小鼠。
47.一種鑒定能夠影響敲除小鼠表型的因子的方法,所述方法包括(a)將推定的因子給予權利要求32的敲除小鼠;(b)測定所述敲除小鼠對所述推定因子的反應;和(c)將所述反應與野生型小鼠的反應比較;(d)從而鑒定出能夠影響敲除小鼠表型的因子。
48.一種因子,所述因子是按照權利要求47的方法鑒定的。
49.一種確定編碼TRP的基因中所述三核苷酸重復的擴增是否引起表型改變的方法,所述方法包括(a)提供權利要求10的敲除細胞和一種包含側翼為重組酶靶位點的三核苷酸重復的合成核酸;(b)使所述敲除干細胞與所述合成核酸在識別所述重組酶靶位點的重組酶存在下進行接觸,使得在所述合成核酸之間發(fā)生重組,從而產(chǎn)生轉基因細胞;和(c)比較所述轉基因細胞與野生型細胞的表型;從而確定三核苷酸擴增是否引起表型改變。
50.權利要求49的方法,其中所述三核苷酸重復包括CTG。
51.權利要求49的方法,其中所述方法包括應用Cre重組酶-lox靶系統(tǒng)。
52.權利要求49的方法,其中所述方法包括應用FLP重組酶-FRT靶系統(tǒng)。
53.一種敲除細胞或細胞系,所述細胞或細胞系在編碼TRP的靶DNA序列中包含破壞。
54.權利要求53的敲除細胞或細胞系,其中所述細胞來源于權利要求32的小鼠。
55.組織,所述組織得自權利要求28或權利要求32的小鼠。
56.權利要求53的敲除細胞,其中所述TRP由T243或其天然存在的等位基因變異體編碼。
57.一種鑒定能夠影響敲除細胞系表型的因子的方法,所述方法包括(a)將權利要求53的敲除細胞與推定的因子接觸;(b)測定所述細胞對所述推定因子的反應;和(c)將所述反應與野生型細胞的反應比較;(d)從而鑒定出能夠影響敲除細胞表型的因子。
58.一種細胞系,所述細胞系包含一種與在所述細胞系中有功能的啟動子有效連接的編碼TRP的核酸序列。
59.權利要求58的細胞系,其中所述TRP由T243或其天然存在的等位基因變異體編碼。
60.權利要求59的細胞系,其中所述TRP基本上由SEQ IDNO52的氨基酸序列或其天然存在的等位基因變異體組成。
61.三核苷酸重復蛋白質,所述蛋白質由T243或其天然存在的等位基因變異體編碼。
62.一種鼠類TRP,所述TRP基本上由SEQ ID NO52的序列或其天然存在的等位基因變異體組成。
63.一種人類TRP,所述TRP基本上由SEQ ID NO58的序列或其天然存在的等位基因變異體組成。
64.一種核酸序列,所述核酸序列編碼權利要求62的鼠類TRP,具有SEQ ID NO47或其天然存在的等位基因變異體的序列。
65.一種核酸序列,所述核酸序列編碼權利要求63的人類TRP,具有SEQ ID NO47或其天然存在的等位基因變異體的序列。
全文摘要
本發(fā)明涉及轉基因動物、與基因功能鑒定相關的組合物和方法。
文檔編號A61P19/00GK1425023SQ00817735
公開日2003年6月18日 申請日期2000年10月26日 優(yōu)先權日1999年10月26日
發(fā)明者R·克萊恩, W·馬休斯, M·莫雷, K·D·阿倫 申請人:德爾塔根公司