專利名稱:鑒定控制分化的基因的方法
相關(guān)申請的相互參照本發(fā)明要求2002年3月15日提交的美國臨時專利申請序列號60/365,359的優(yōu)先權(quán)。
關(guān)于聯(lián)邦資助研究或開發(fā)的聲明不適用。
背景技術(shù):
現(xiàn)代細(xì)胞生物學(xué)包括多種在體外操作活生物體的各種細(xì)胞的技術(shù)。一種特別重要且使人感興趣的細(xì)胞培養(yǎng)是干細(xì)胞。干細(xì)胞是未分化的或僅部分分化的細(xì)胞,它具有分化成多種祖細(xì)胞類型的能力。術(shù)語“干細(xì)胞”可用來指一種細(xì)胞類型,這種類型在較大生物體中是一類細(xì)胞類型的祖先,如造血干細(xì)胞,或可指所有未分化的干細(xì)胞,至少在理論上,這種細(xì)胞能夠分化入整個生物體的身體的任何組織。已從各種組織和在很多不同動物中進(jìn)行了干細(xì)胞培養(yǎng)。
最近已經(jīng)能夠產(chǎn)生、培養(yǎng)和保持靈長類胚胎干細(xì)胞的培養(yǎng)物,包括人胚胎干細(xì)胞。例如,參見授予Thomson的美國專利5,843,780和6,200,806。靈長類胚胎干細(xì)胞是最初由取自胚胎的細(xì)胞產(chǎn)生的、在培養(yǎng)物中無限存活的干細(xì)胞培養(yǎng)物,并由能夠分化成靈長類身體的主要組織類型的細(xì)胞構(gòu)成。靈長類胚胎干細(xì)胞可在培養(yǎng)物中保持未分化狀態(tài),或者可開始分化過程,通過此過程細(xì)胞指定用于一種或另一種發(fā)育的細(xì)胞譜系。通常,干細(xì)胞分化成不同組織類型開始于胚胎樣小體的形成,這使得胚胎樣小體中的干細(xì)胞開始分化成胚胎樣小體的不同部位中的不同細(xì)胞類型。事實上,使人胚胎干細(xì)胞維持在未分化狀態(tài)需要小心注意培養(yǎng)條件,如果培養(yǎng)條件不正確,細(xì)胞將會自發(fā)開始不受控制的分化。
干細(xì)胞的發(fā)育所賦予的一個備受矚目的研究領(lǐng)域是開始試圖了解那種基因或因子使未分化的細(xì)胞開始分化成定向細(xì)胞譜系。理論上,當(dāng)干細(xì)胞大部分起始分化時,一個遺傳因子打開或關(guān)閉從而使干細(xì)胞開始表達(dá)一些基因而不是其它基因,從而定向到一種特定細(xì)胞譜系。鑒定負(fù)責(zé)這種起始分化步驟的遺傳因子并非是無關(guān)緊要的問題。然而在科學(xué)上,這種研究對于了解活生物體的最初發(fā)育是重要的。
可能在干細(xì)胞和造成分化第一個步驟的細(xì)胞之間進(jìn)行比較RNA分析,并鑒定在子代細(xì)胞中產(chǎn)生了何種在干細(xì)胞中未產(chǎn)生的RNA。采用比較RNA表達(dá)研究可能知道,當(dāng)細(xì)胞定向到特定譜系時,與其產(chǎn)生的未分化的干細(xì)胞相比,哪個基因被打開。然而,具有被打開的基因目錄對于從作為該過程的結(jié)果被打開的大量基因中區(qū)別引發(fā)該過程的一個或多個基因沒有幫助。事實上,采用比較RNA分析來識別引發(fā)分化過程的基因?qū)⑹掷щy或不實用,這是因為無需大量產(chǎn)生胞內(nèi)因子,如轉(zhuǎn)錄因子,以在細(xì)胞分化中有發(fā)生變化的作用。還沒有已被證實用來鑒定負(fù)責(zé)原代細(xì)胞分化的因子的方法。
發(fā)明概述本發(fā)明總結(jié)了負(fù)責(zé)細(xì)胞由起始細(xì)胞類型分化成靶細(xì)胞類型的細(xì)胞因子的鑒定方法。該方法開始于通過使用cDNA文庫隨機克隆表達(dá)的基因,所述cDNA來自靶細(xì)胞類型。所述cDNA基因被轉(zhuǎn)移到對起始細(xì)胞類型的細(xì)胞有效的表達(dá)載體。所述表達(dá)載體被轉(zhuǎn)移到起始細(xì)胞,然后培養(yǎng)細(xì)胞以使其分化成靶細(xì)胞類型。鑒定那些已經(jīng)分化成所需靶細(xì)胞類型的細(xì)胞,優(yōu)選使用可選擇標(biāo)記。然后從分化的細(xì)胞回收DNA,并分析該DNA以確定那種插入的cDNA造成了向靶細(xì)胞類型的分化。用這種方法就可鑒定出負(fù)責(zé)特定單細(xì)胞分化的細(xì)胞因子。
本發(fā)明的一個目的是提供一種鑒定負(fù)責(zé)原代細(xì)胞分化的因子的方法。
本發(fā)明的一個特征是可以鑒定負(fù)責(zé)從人胚胎干細(xì)胞開始的細(xì)胞分化最初階段的遺傳因子。
通過以下詳述將了解本發(fā)明的其它目的、優(yōu)點和特征。
附圖簡述
圖1和2例舉了適合用于本發(fā)明方法的載體。
發(fā)明詳述本發(fā)明試圖鑒定負(fù)責(zé)未分化細(xì)胞最初分化成分化或部分分化細(xì)胞的基因或遺傳因子。這里描述的方法還可用來鑒定使最初分化的細(xì)胞進(jìn)一步分化成體內(nèi)各種細(xì)胞譜系的基因或遺傳因子。所述方法,這里稱為表達(dá)克隆(expression cloning),采用置于表達(dá)載體并被插入感興趣的未分化細(xì)胞的基因表達(dá)文庫。然后使未分化的細(xì)胞分化。然后鑒定已經(jīng)分化成有特殊興趣的細(xì)胞類型的那些細(xì)胞。靶細(xì)胞一旦被鑒定,就可使用常規(guī)的DN鑒定技術(shù)來鑒別使分化的細(xì)胞分化成感興趣的細(xì)胞類型的cDNA種類。
本發(fā)明可鑒定負(fù)責(zé)細(xì)胞分化的第一階段的遺傳因子,即鑒定那些使大多數(shù)未分化的細(xì)胞、多能干細(xì)胞開始分化入身體各種組織的過程的因子。尤其是使用人干細(xì)胞,有可有使用此方法確定哪種遺傳因子引起干細(xì)胞開始分化成各種最終形成人體的所有細(xì)胞的細(xì)胞譜系。由于本方法的技術(shù)和細(xì)節(jié)可以用于人胚胎干細(xì)胞,可預(yù)計該方法可用于培養(yǎng)物中許多細(xì)胞類型的多個分化階段,從一開始的未分化的細(xì)胞到最終分化的靶細(xì)胞類型。術(shù)語“人未分化的干細(xì)胞”在這里指具有人胚胎干細(xì)胞發(fā)育潛能的細(xì)胞,特別包括衍生自其它來源的細(xì)胞,如人胚胎種系細(xì)胞和衍生自成熟或成體的干細(xì)胞。
因此,本發(fā)明的方法開始于選擇起始細(xì)胞類型,如未分化的細(xì)胞類型,和靶細(xì)胞類型,如經(jīng)歷從干細(xì)胞到一些其它細(xì)胞類型的前體的分化步驟的細(xì)胞。出于舉例的目的,假定靶細(xì)胞類型是定向到神經(jīng)細(xì)胞譜系的細(xì)胞,但其它未分化的細(xì)胞類型在這里是指神經(jīng)前體細(xì)胞。
所述方法的下一步是從細(xì)胞中選擇表達(dá)基因的文庫。有兩種方法可實現(xiàn)此目的,建立文庫或使用參考文庫。通常,當(dāng)需要收集指導(dǎo)基因表達(dá)的核酸時,可以使用或建立所述組織、細(xì)胞或生物體的cDNA文庫。cDNA文庫通常由mRNA制成,所述mRNA存在于靶細(xì)胞類型譜系的細(xì)胞中,且最適合由靶細(xì)胞類型本身制成。其它選擇是使用參考文庫收集。例如,正在美國國立衛(wèi)生研究院(U.S.National Institutes ofHealth)的指導(dǎo)下進(jìn)行合作科學(xué)研究以建立稱為哺乳動物基因收集(MGC)的基因收集。MGC是一種限定的基因表達(dá)文庫,它將克服使用由單個實驗或研究制成的mRNA文庫的一些限制。MGC將包括小鼠和人cDNA文庫的全長轉(zhuǎn)錄物的克隆、標(biāo)識符和序列。使用參考文庫的克隆組可確??寺∈侨L的,并避免與實驗創(chuàng)建的mRNA文庫有關(guān)的兩個常見問題。這兩個問題是,mRNA文庫有助于重復(fù)表達(dá)在用來建立文庫的細(xì)胞中表達(dá)高豐度基因以及文庫中的克隆通常不是全長的。通常,由于能夠更好的代表cDNA種類和全長的克隆成員,預(yù)計使用表達(dá)基因的參考文庫通常將更加有效和優(yōu)選。使用參考文庫還可以鑒定克隆或基因的亞組,優(yōu)選地檢測所需的基因種類,如轉(zhuǎn)錄調(diào)節(jié)物,優(yōu)選于其它基因或者限制必需產(chǎn)生的克隆的數(shù)目。因此,仍以神經(jīng)前體細(xì)胞為例,用任一方法建立了cDNA文庫以代表mRNA種類,所述mRNA種類存在于最終分化的神經(jīng)細(xì)胞、神經(jīng)前體細(xì)胞或定位在這兩者之間譜系內(nèi)的任何細(xì)胞中。
盡管本方法可用來檢測負(fù)責(zé)分化的基因,它也可反方向使用。如果起始細(xì)胞是分化的細(xì)胞而靶細(xì)胞是未分化的干細(xì)胞,所述方法可用來鑒定控制細(xì)胞狀態(tài)為干細(xì)胞的基因。
然后將cDNA文庫種類克隆入能夠在靈長類未分化干細(xì)胞中表達(dá)的表達(dá)載體。當(dāng)其關(guān)閉時,許多哺乳動物基因表達(dá)載體在干細(xì)胞中無法良好工作。因此,對表達(dá)載體的選擇是一個臨界參數(shù),這將在下面詳細(xì)討論。
表達(dá)載體不僅包括在轉(zhuǎn)染的干細(xì)胞中表達(dá)的cDNA種類,而且包括可用來檢測成功轉(zhuǎn)化體的標(biāo)記基因系統(tǒng)。需要這種標(biāo)記系統(tǒng)來鑒定來自干細(xì)胞培養(yǎng)物的已經(jīng)歷所需分化步驟的細(xì)胞,這可從下面的討論中了解。標(biāo)記基因系統(tǒng)可包括可篩選的標(biāo)記,它可用來篩選轉(zhuǎn)化體細(xì)胞,或可選擇標(biāo)記,該標(biāo)記是選擇轉(zhuǎn)化體的選擇劑并可鑒定表達(dá)標(biāo)記基因的轉(zhuǎn)化體細(xì)胞。對于可篩選標(biāo)記,如綠色熒光蛋白基因,該基因可在表達(dá)細(xì)胞上發(fā)出熒光,篩選細(xì)胞培養(yǎng)物用于檢測表型如細(xì)胞熒光的表達(dá)。對于可選擇標(biāo)記,如抗生素抗性基因,將細(xì)胞培養(yǎng)物暴露于選擇劑,如抗生素,該選擇劑對表達(dá)可選擇標(biāo)記基因的細(xì)胞以外的所有細(xì)胞有毒性,而表達(dá)該基因的細(xì)胞表現(xiàn)出抗生素抗性。使用這種標(biāo)記系統(tǒng)是基因轉(zhuǎn)化操作中的常規(guī)方法,且標(biāo)記的許多其它類型和例子是本領(lǐng)域已知的。
同樣優(yōu)選的是,所述標(biāo)記系統(tǒng)受控于對靶細(xì)胞的細(xì)胞類型特異的組織特異性啟動子。例如,如果用可選擇抗生素抗性基因來識別負(fù)責(zé)分化成神經(jīng)前體細(xì)胞的基因,所述抗生素抗性基因或許在組織特異性啟動子的控制下,該啟動子只表達(dá)它在神經(jīng)細(xì)胞中所控制的基因。這樣,只有當(dāng)轉(zhuǎn)化入標(biāo)記的細(xì)胞分化成靶細(xì)胞類型時該標(biāo)記才被表達(dá)。
因此,所述方法如下。產(chǎn)生cDNA文庫并克隆入表達(dá)載體系統(tǒng)。將該表達(dá)載體(包括cDNA文庫和標(biāo)記系統(tǒng))轉(zhuǎn)化入該細(xì)胞類型的細(xì)胞。然后培養(yǎng)起始細(xì)胞類型的培養(yǎng)物。優(yōu)選該培養(yǎng)物不含適合細(xì)胞分化的其它條件。事實上,優(yōu)選該步驟的細(xì)胞培養(yǎng)物有利于細(xì)胞保持未分化狀態(tài)。這樣,只有當(dāng)插入并表達(dá)的cDNA存在時才會分化的細(xì)胞將實際上發(fā)生分化。分化的細(xì)胞可用多種方法檢測。一種方法僅檢測與所需分化步驟一致的細(xì)胞形態(tài)變化。優(yōu)選的方法是使用標(biāo)記系統(tǒng),該標(biāo)記系統(tǒng)包含在用于此目的的表達(dá)載體中。該標(biāo)記系統(tǒng)用來檢測然后表達(dá)標(biāo)記系統(tǒng)的細(xì)胞,表明驅(qū)動標(biāo)記系統(tǒng)的組織特異性啟動子已經(jīng)開始驅(qū)動表達(dá)。這說明細(xì)胞已經(jīng)分化成靶細(xì)胞。此時,應(yīng)該確定被轉(zhuǎn)化入這種特定細(xì)胞的cDNA種類或負(fù)責(zé)從起始細(xì)胞類型分化成靶細(xì)胞類型的細(xì)胞。現(xiàn)在有必要鑒定這是何種cDNA。
接下來的步驟通過PCR反應(yīng)最容易進(jìn)行。表達(dá)載體前面已經(jīng)描述過,這樣圍繞cDNA區(qū)段的載體中5’和3’側(cè)翼區(qū)是已知的。因此可從分化的細(xì)胞回收DNA,并在回收的DNA上進(jìn)行PCR,PCR引物選自cDNA插入物的任一側(cè)上表達(dá)載體中的側(cè)翼區(qū)。PCR產(chǎn)物是從一個引物延伸到另一個引物的擴增的DNA,該延伸越過cDNA插入物。通過測序PCR反應(yīng)產(chǎn)物的DNA,可確定引起細(xì)胞分化的cDNA插入物的DNA序列。假設(shè)細(xì)胞僅被一種表達(dá)載體轉(zhuǎn)化,這表明當(dāng)此單一cDNA編碼的蛋白質(zhì)在未分化的細(xì)胞中表達(dá)時,可使該細(xì)胞向靶細(xì)胞類型分化。換言之,該方法可鑒定負(fù)責(zé)細(xì)胞譜系分化的一個步驟的單個遺傳因子。
注意到該方法需要篩選多個克隆以發(fā)現(xiàn)與分化事件有關(guān)的克隆。由于篩選大量克隆很繁重,再需注意的是,使用良好定義的文庫會使整個過程更有效。在實驗室制備的文庫中,全長克隆的數(shù)目是可以改變的。由于篩選在這里是相對稀少的事件,越是將文庫限制在僅包括感興趣的基因,搜索感興趣基因就越短。用非隨機文庫或定義文庫就可以從文庫成員數(shù)目為可管理數(shù)目的文庫開始。例如,目前認(rèn)為人類基因組僅含有約50,000個開發(fā)閱讀框。例如,如果更加嚴(yán)格地限制文庫中的克隆為僅包括參與轉(zhuǎn)錄控制的種類,數(shù)目可進(jìn)一步減少。
如前所述,這種表達(dá)克隆技術(shù)需要使用在未分化細(xì)胞類型中工作的克隆載體。關(guān)于人胚胎干細(xì)胞的研究,發(fā)現(xiàn)適合在人胚胎干細(xì)胞中表達(dá)外源基因的表達(dá)載體并非是無關(guān)緊要的任務(wù)。大多數(shù)在哺乳動物細(xì)胞中有用的表達(dá)載體不以任何合理的效率程度在人胚胎干細(xì)胞中工作。已經(jīng)發(fā)現(xiàn)兩種可以在人胚胎干細(xì)胞中表達(dá)外源基因的表達(dá)載體。這兩種載體是基于EB病毒的表達(dá)載體和慢病毒表達(dá)載體。
EB病毒(EBV)表達(dá)載體是基于市售的表達(dá)載體。EBV含有一個約172kb的基因組并以一種多拷貝的環(huán)狀附加體維持于轉(zhuǎn)化的細(xì)胞染色體之外。該附加體隨細(xì)胞復(fù)制并精確分配到子細(xì)胞中。已經(jīng)發(fā)現(xiàn)EBV載體能夠?qū)⒑胁迦氲腄NA構(gòu)建物的附加體轉(zhuǎn)移到人胚胎干細(xì)胞中,它然后在轉(zhuǎn)化的干細(xì)胞中精確地表達(dá)。基于EBV的表達(dá)載體的其它信息收錄在本申請文件的附錄1中。
慢病毒載體基于包括人免疫缺陷病毒(HIV)在內(nèi)的逆轉(zhuǎn)錄病毒家族。已經(jīng)證實慢病毒載體對于轉(zhuǎn)化人胚胎干細(xì)胞有效。所述慢病毒基因組含有所有逆轉(zhuǎn)錄病毒所共有的結(jié)構(gòu)基因(gag、pol和env),此外還含有兩個調(diào)節(jié)基因(tat和rev)和四個輔助基因(vpr、vif、vpu和nef)。這四個輔助基因在復(fù)制和體內(nèi)發(fā)病機制中發(fā)揮作用并可從慢病毒載體中除去,盡管其中一些對一些細(xì)胞類型的表達(dá)載體功能有益。在考慮用于本發(fā)明所述方法的慢病毒載體中,質(zhì)粒載體被用來在包裝細(xì)胞系中表達(dá)gag、pol、tat和rev,但基因的完整拷貝被從轉(zhuǎn)移到入細(xì)胞系的實際轉(zhuǎn)移表達(dá)載體中除去。逆轉(zhuǎn)錄病毒的向性主要由env蛋白決定,該蛋白結(jié)合特定的細(xì)胞表面受體。因此,缺少合適細(xì)胞表面受體的細(xì)胞難以被慢病毒轉(zhuǎn)化。為了將最廣的可能向性授于表達(dá)載體,用水泡性口炎病毒(VSV)G糖蛋白對慢病毒載體進(jìn)行假型處理。VSV-G與細(xì)胞膜的磷脂組分直接相互作用,從而通過與細(xì)胞膜融合而介導(dǎo)病毒進(jìn)入細(xì)胞。VSV-G可替代逆轉(zhuǎn)錄病毒中的env蛋白以產(chǎn)生具有非常廣的向性的雜交假型病毒顆粒。表達(dá)載體可衍生自含有HIV的順式作用序列的載體用于包裝、逆轉(zhuǎn)錄和整合。這些序列包括5’LTR、前導(dǎo)序列和5’剪切供體位點,gag基因約360個堿基對,以及防止gag序列翻譯的限制性內(nèi)切酶移碼突變,含有Rev效應(yīng)元件(RRE)以用于核輸出的env基因的700個堿基對,3’剪切受體位點和HIV 3’LTR。為降低病毒序列對受控于內(nèi)部啟動子的基因表達(dá)的可能的干擾效應(yīng),所有載體還包含3’HIV LTR的U3區(qū)域的400個堿基對缺失。在隨后的基因組整合中,由于這種序列在逆轉(zhuǎn)錄期間被拷貝到5’LTR,5’LTR啟動子/增強子在整合入宿主基因組之后被非功能化。經(jīng)過這種修飾的載體有時被稱為自失活。
慢病毒載體可感染非分裂細(xì)胞,這是對此目的被認(rèn)為是重要的。慢病毒載體感染非分化細(xì)胞的能力是通過gag、pol和vpr基因的基因產(chǎn)物介導(dǎo)的。最近鑒別了另一種與核輸入有關(guān)的元件是存在于pol編碼區(qū)內(nèi)的順式?jīng)Q定子,稱為中央嘌呤束(central purine tract)(cPPT)。由于這個原因,cPPT區(qū)域?qū)⒈粨饺氡景l(fā)明的慢病毒載體中用于本發(fā)明。由于慢病毒隨機整合入基因組,整合位置效應(yīng)有助于在整合后不久載體的轉(zhuǎn)錄沉默和表達(dá)多樣性和還有助于表達(dá)的消失。
為構(gòu)建實際的慢病毒載體,我們從作為禮物來自Robert Hawley,American RedCross,Rockville,Md的慢病毒載體pSIN-EF-EGFP開始。為修飾載體以用于人胚胎干細(xì)胞,修飾該載體以減小構(gòu)建物的大小并使重組更加有效。為簡化亞序列克隆步驟,用BamHI消化從載體中除去GFP盒,并重新結(jié)合載體,重新連接載體,重新連接的載體稱為pSIN-EF-del。為減小載體的大小,從NcoI位點(8990)到HpaI位點(202)刪去1909個堿基對以制備稱為pSIN-EF-del2的載體。這將載體的大小從10659個堿基對減小到8750個堿基對。然后將GATEWAY(Invitrogen,Life Sciences,Carlsbad,CA)載體轉(zhuǎn)化盒B加入原始載體中4082個堿基對處的SmaI位點以制備稱為pSIN-EF-de12-GATEWAY的載體。該載體現(xiàn)在被用來將單個克隆、克隆組或整個文庫直接轉(zhuǎn)移到用于過度表達(dá)研究的慢病毒載體。該載體在圖1中說明且其序列包含在SEQIDNO1中。
已推進(jìn)了基于EBV的載體的發(fā)展。EBV載體獲自威斯康星大學(xué)(the Universityof Wisconsin)的William Sugden實驗室。為修飾所得載體(p2300)以用于人胚胎干細(xì)胞,將啟動子由CMV啟動子變換成EF1α啟動子。此外,加入多接頭以制備易于用常規(guī)的連接介導(dǎo)的克隆(ligation-mediated cloning)步驟操作的載體。此外,在載體中加入GATEWAY盒以使載體與重組系統(tǒng)相容。
為產(chǎn)生這些變化,我們從用下面的引物JS1和JS2擴增綠色熒光蛋白(GFP)的基因開始,所述引物含有多個限制性位點。PCR產(chǎn)物用NotI和ClaI消化并克隆入p2300的NotI/ClaI位點。所得質(zhì)粒稱為pJMS001。然后用下面的引物JS5和JS7擴增EF1α啟動子,產(chǎn)物用SmaI和EcoRI消化,所得片段連接入pJMS001的NruI/EcoRI位點。所得質(zhì)粒稱為pJMS002。pJMS002然后用EcoRI和BamHI切割,用T4-DNA聚合酶平端。GATEWAY盒B被連接入該質(zhì)粒,得到稱為pJMS002-GATEWAY的質(zhì)粒。這種載體適合用于本文所述的方法,它在圖2中說明,其序列示于SEQIDNO2。
引物列表JSIGCATCGATTTCGAAGAATTCCACCGGTCGCCACCATGGTGJS2AAAAGGAAAAGCGGCCGCCTCGAGGGATCCTTTACTTGTACAGCTCGTCCJS5CGGCCCGGGGTGAGGCTCCGGTGCCCGTCJS7GGCGAATTCGAACTCGAGACCACGTGTTCACGACACC
序列表<110>J.A.湯姆森(Thomson,James)<120>鑒定控制分化的基因的方法<130>960296.98822<140>10/000,000<141>2003-03-14<150>60/365,359<151>2002-03-15<160>2<170>PatentIn Ver.2.1<210>1<211>10463<212>DNA<213>人工序列<220>
<223>人工序列的描述載體<400>1gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 60acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 120tcttatcatg tctggatcaa ctggataact caagctaacc aaaatcatcc caaacttccc 180accccatacc ctattaccac tgccaattac ctgtggtttc atttactcta aacctgtgat 240tcctctgaat tattttcatt ttaaagaaat tgtatttgtt aaatatgtac tacaaactta 300gtagttggaa gggctaattc actcccaaag aagacaagat atccttgatc tgtggatcta 360ccacacacaa ggctacttcc ctgattagca gaactacaca ccagggccag gggtcagata 420tccactgacc tttggatggt gctacaagct agtaccagtt gagccagata aggtagaaga 480ggccaataaa ggagagaaca ccagcttgtt acaccctgtg agcctgcatg ggatggatga 540cccggagaga gaagtgttag agtggaggtt tgacagccgc ctagcatttc atcacgtggc 600ccgagagctg catccggagt acttcaagaa ctgctgatat cgagcttgct acaagggact 660ttccgctggg gactttccag ggaggcgtgg cctgggcggg actggggagt ggcgagccct 720cagatcctgc atataagcag ctgctttttg cctgtactgg gtctctctgg ttagaccaga 780tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct 840tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat 900ccctcagacc cttttagtca gtgtggaaaa tctctagcag tggcgcccga acagggactt 960gaaagcgaaa gggaaaccag aggagctctc tcgacgcagg actcggcttg ctgaagcgcg 1020cacggcaaga ggcgaggggc ggcgactggt gagtacgcca aaaattttga ctagcggagg 1080ctagaaggag agagatgggt gcgagagcgt cagtattaag cgggggagaa ttagatcgcg 1140atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa tataaattaa aacatatagt 1200atgggcaagc agggagctag aacgattcgc agttaatcct ggcctgttag aaacatcaga 1260
aggctgtaga caaatactgg gacagctaca accatccctt cagacaggat cagaagaact 1320tagatcatta tataatacag tagcaaccct ctattgtgtg catcaaagga tagagataaa 1380agacaccaag gaagctttag acaagataga ggaagagcaa aacaaaagta agaccaccgc 1440acagcaagcg gccgctgatc ttcagacctg gaggaggaga tatgagggac aattggagaa 1500gtgaattata taaatataaa gtagtaaaaa ttgaaccatt aggagtagca cccaccaagg 1560caaagagaag agtggtgcag agagaaaaaa gagcagtggg aataggagct ttgttccttg 1620ggttcttggg agcagcagga agcactatgg gcgcagcgtc aatgacgctg acggtacagg 1680ccagacaatt attgtctggt atagtgcagc agcagaacaa tttgctgagg gctattgagg 1740cgcaacagca tctgttgcaa ctcacagtct ggggcatcaa gcagctccag gcaagaatcc 1800tggctgtgga aagataccta aaggatcaac agctcctggg gatttggggt tgctctggaa 1860aactcatttg caccactgct gtgccttgga atgctagttg gagtaataaa tctctggaac 1920agatttggaa tcacacgacc tggatggagt gggacagaga aattaacaat tacacaagct 1980taatacactc cttaattgaa gaatcgcaaa accagcaaga aaagaatgaa caagaattat 2040tggaattaga taaatgggca agtttgtgga attggtttaa cataacaaat tggctgtggt 2100atataaaatt attcataatg atagtaggag gcttggtagg tttaagaata gtttttgctg 2160tactttctat agtgaataga gttaggcagg gatattcacc attatcgttt cagacccacc 2220tcccaacccc gaggggaccc gacaggcccg aaggaataga agaagaaggt ggagagagag 2280acagagacag atccattcga ttagtgaacg gatctcgacg gtatcgccac aaatggcagt 2340attcatccac aattttaaaa gaaagggggg gattgggggg tacagtgcag gggaaagaat 2400agtagacata atagcaacag acatacaaac taaagaatta caaaaacaaa ttacaaaaat 2460tcaaaatttt cgggtttatt acagggacag cagagatcca ctttggatcg ataagctttg 2520caaagatgga taaagtttta aacagagagg aatctttgca gctaatggac cttctaggtc 2580ttgaaaggag tgggaattgg ctccggtgcc cgtcagtggg cagagcgcac atcgcccaca 2640gtccccgaga agttgggggg aggggtcggc aattgaaccg gtgcctagag aaggtggcgc 2700ggggtaaact gggaaagtga tgtcgtgtac tggctccgcc tttttcccga gggtggggga 2760gaaccgtata taagtgcagt agtcgccgtg aacgttcttt ttcgcaacgg gtttgccgcc 2820agaacacagg taagtgccgt gtgtggttcc cgcgggcctg gcctctttac gggttatggc 2880ccttgcgtgc cttgaattac ttccacctgg ctgcagtacg tgattcttga tcccgagctt 2940cgggttggaa gtgggtggga gagttcgagg ccttgcgctt aaggagcccc ttcgcctcgt 3000gcttgagttg aggcctggcc tgggcgctgg ggccgccgcg tgcgaatctg gtggcacctt 3060cgcgcctgtc tcgctgcttt cgataagtct ctagccattt aaaatttttg atgacctgct 3120gcgacgcttt ttttctggca agatagtctt gtaaatgcgg gccaagatct gcacactggt 3180atttcggttt ttggggccgc gggcggcgac ggggcccgtg cgtcccagcg cacatgttcg 3240gcgaggcggg gcctgcgagc gcggccaccg agaatcggac gggggtagtc tcaagctggc 3300cggcctgctc tggtgcctgg cctcgcgccg ccgtgtatcg ccccgccctg ggcggcaagg 3360ctggcccggt cggcaccagt tgcgtgagcg gaaagatggc cgcttcccgg ccctgctgca 3420gggagctcaa aatggaggac gcggcgctcg ggagagcggg cgggtgagtc acccacacaa 3480aggaaaaggg cctttccgtc ctcagccgtc gcttcatgtg actccacgga gtaccgggcg 3540ccgtccaggc acctcgatta gttctcgagc ttttggagta cgtcgtcttt aggttggggg 3600gaggggtttt atgcgatgga gtttccccac actgagtggg tggagactga agttaggcca 3660gcttggcact tgatgtaatt ctccttggaa tttgcccttt ttgagtttgg atcttggttc 3720attctcaagc ctcagacagt ggttcaaagt ttttttcttc catttcaggt gtcgtgagga 3780attcgatatc aagcttatcg atagatctgt cgactaaatt ctgcagtcga cggtaccgcg 3840ggatcaacaa gtttgtacaa aaaagctgaa cgagaaacgt aaaatgatat aaatatcaat 3900atattaaatt agattttgca taaaaaacag actacataat actgtaaaac acaacatatc 3960cagtcactat ggcggccgca ttaggcaccc caggctttac actttatgct tccggctcgt 4020ataatgtgtg gattttgagt taggatccgg cgagattttc aggagctaag gaagctaaaa 4080tggagaaaaa aatcactgga tataccaccg ttgatatatc ccaatggcat cgtaaagaac 4140
attttgaggc atttcagtca gttgctcaat gtacctataa ccagaccgtt cagctggata 4200ttacggcctt tttaaagacc gtaaagaaaa ataagcacaa gttttatccg gcctttattc 4260acattcttgc ccgcctgatg aatgctcatc cggaattccg tatggcaatg aaagacggtg 4320agctggtgat atgggatagt gttcaccctt gttacaccgt tttccatgag caaactgaaa 4380cgttttcatc gctctggagt gaataccacg acgatttccg gcagtttcta cacatatatt 4440cgcaagatgt ggcgtgttac ggtgaaaacc tggcctattt ccctaaaggg tttattgaga 4500atatgttttt cgtctcagcc aatccctggg tgagtttcac cagttttgat ttaaacgtgg 4560ccaatatgga caacttcttc gcccccgttt tcaccatggg caaatattat acgcaaggcg 4620acaaggtgct gatgccgctg gcgattcagg ttcatcatgc cgtctgtgat ggcttccatg 4680tcggcagaat gcttaatgaa ttacaacagt actgcgatga gtggcagggc ggggcgtaaa 4740gatctggatc cggcttacta aaagccagat aacagtatgc gtatttgcgc gctgattttt 4800gcggtataag aatatatact gatatgtata cccgaagtat gtcaaaaaga ggtgtgctat 4860gaagcagcgt attacagtga cagttgacag cgacagctat cagttgctca aggcatatat 4920gatgtcaata tctccggtct ggtaagcaca accatgcaga atgaagcccg tcgtctgcgt 4980gccgaacgct ggaaagcgga aaatcaggaa gggatggctg aggtcgcccg gtttattgaa 5040atgaacggct cttttgctga cgagaacagg gactggtgaa atgcagttta aggtttacac 5100ctataaaaga gagagccgtt atcgtctgtt tgtggatgta cagagtgata ttattgacac 5160gcccgggcga cggatggtga tccccctggc cagtgcacgt ctgctgtcag ataaagtctc 5220ccgtgaactt tacccggtgg tgcatatcgg ggatgaaagc tggcgcatga tgaccaccga 5280tatggccagt gtgccggtct ccgttatcgg ggaagaagtg gctgatctca gccaccgcga 5340aaatgacatc aaaaacgcca ttaacctgat gttctgggga atataaatgt caggctccct 5400tatacacagc cagtctgcag gtcgaccata gtgactggat atgttgtgtt ttacagtatt 5460atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg 5520tttctcgttc agctttcttg tacaaagtgg ttgatcccgg gatccctcga gacctagaaa 5580aacatggagc aatcacaagt agcaatacag cagctaccaa tgctgattgt gcctggctag 5640aagcacaaga ggaggaggag gtgggttttc cagtcacacc tcaggtacct ttaagaccaa 5700tgacttacaa ggcagctgta gatcttagcc actttttaaa agaaaagggg ggactggaag 5760ggctaattca ctcccaacga agacaagatc tgctttttgc ttgtactggg tctctctggt 5820tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg cttaagcctc 5880aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt gactctggta 5940actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt agtagttcat 6000gtcatcttat tattcagtat ttataacttg caaagaaatg aatatcagag agtgagaggc 6060cttgacatta taatagattt agcaggaatt gaactaggag tggagcacac aggcaaagct 6120gcagaagtac ttggaagaag ccaccagaga tactcacgat tctgcacata cctggctaat 6180cccagatcct aaggattaca ttaagtttac taacatttat ataatgattt atagtttaaa 6240gtataaactt atctaattta ctattctgac agatattaat taatcctcaa atatcataag 6300agatgattac tattatcccc atttaacaca agaggaaact gagagggaaa gatgttgaag 6360taattttccc acaattacag catccgttag ttacgactct atgatcttct gacacaaatt 6420ccatttactc ctcaccctat gactcagtcg aatatatcaa agttatggac attatgctaa 6480gtaacaaatt acccttttat atagtaaata ctgagtagat tgagagaaga aattgtttgc 6540aaacctgaat agcttcaaga agaagagaag tgaggataag aataacagtt gtcatttaac 6600aagttttaac aagtaacttg gttagaaagg gattcaaatg cataaagcaa gggataaatt 6660tttctggcaa caagactata caatataacc ttaaatatga cttcaaataa ttgttggaac 6720ttgataaaac taattaaata ttattgaaga ttatcaatat tataaatgta atttactttt 6780aaaaagggaa catagaaatg tgtatcatta gagtagaaaa caatccttat tatcacaatt 6840tgtcaaaaca agtttgttat taacacaagt agaatactgc attcaattaa gttgactgca 6900gattttgtgt tttgttaaaa ttagaaagag ataacaacaa tttgaattat tgaaagtaac 6960atgtaaatag ttctacatac gttcttttga catcttgttc aatcattgat cgaagttctt 7020
tatcttggaa gaatttgttc caaagactct gaaataagga aaacaatcta ttatatagtc 7080tcacaccttt gttttacttt tagtgatttc aatttaataa tgtaaatggt taaaatttat 7140tcttctctga gatcatttca cattgcagat agaaaacctg agactggggt aatttttatt 7200aaaatctaat ttaatctcag aaacacatct ttattctaac atcaattttt ccagtttgat 7260attatcatat aaagtcagcc ttcctcatct gcaggttcca caacaaaaat ccaaccaact 7320gtggatcaaa aatattggga aaaaattaaa aatagcaata caacaataaa aaaatacaaa 7380tcagaaaaac agcacagtat aacaacttta tttagcattt acaatctatt aggtattata 7440agtaatctag aattaattcc gtgtattcta tagtgtcacc taaatcgtat gtgtatgata 7500cataaggtta tgtattaatt gtagccgcgt tctaacgaca atatgtacaa gcctaattgt 7560gtagcatctg gcttactgaa gcagacccta tcatctctct cgtaaactgc cgtcagagtc 7620ggtttggttg gacgaacctt ctgagtttct ggtaacgccg tcccgcaccc ggaaatggtc 7680agcgaaccaa tcagcagggt catcgctagc cagatcctct acgccggacg catcgtggcc 7740ggcatcaccg gcgccacagg tgcggttgct ggcgcctata tcgccgacat caccgatggg 7800gaagatcggg ctcgccactt cgggctcatg agcgcttgtt tcggcgtggg tatggtggca 7860ggccccgtgg ccgggggact gttgggcgcc atctccttgc atgcaccatt ccttgcggcg 7920gcggtgctca acggcctcaa cctactactg ggctgcttcc taatgcagga gtcgcataag 7980ggagagcgtc gaatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 8040gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 8100cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 8160atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc ctatttttat aggttaatgt 8220catgataata atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac 8280ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 8340ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 8400cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 8460ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 8520tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 8580cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 8640actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 8700aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 8760tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 8820ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 8880tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 8940gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 9000gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 9060tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 9120gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat g180ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 9240gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 9300aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 9360ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 9420ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 9480tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 9540gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt 9600agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 9660taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 9720gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 9780gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 9840caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 9900
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 9960tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 10020acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 10080ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 10140gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 10200tctccccgcg cgttggccga ttcattaatg cagctgtgga atgtgtgtca gttagggtgt 10260ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 10320gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 10380ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 10440cccagttccg cccattctcc gcc 10463<210>2<211>9249<212>DNA<213>人工序列<220>
<223>人工序列的描述載體<400>2gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180ttagggttag gcgttttgcg ctgcttcggg ggtgaggctc cggtgcccgt cgtgaggctc 240cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt tggggggagg 300ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg aaagtgatgt 360cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa gtgcagtagt 420cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa gtgccgtgtg 480tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattacttc 540cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg gccttgcgct 600ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg gggccgccgc 660gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc tctagccatt 720taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct tgtaaatgcg 780ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga cggggcccgt 840gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc gagaatcgga 900cgggggtcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct ggcctcgcgc 960cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca gttgcgtgag 1020cggaaagatg gccgcttccc ggccctgctc cagggggctc aaaatggagg acgcggcgct 1080cgggagagcg ggcgggtgag tcacccacac aaaggaaagg ggcctttccg tcctcagccg 1140tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat tagttctgga 1200gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg gagtttcccc 1260acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa ttctccttgg 1320aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca gtggttcaaa 1380gtttttttct tccatttcag gtgtcaagaa cacatggtct cgagttcatc aacaagtttg 1440tacaaaaaag ctgaacgaga aacgtaaaat gatataaata tcaatatatt aaattagatt 1500ttgcataaaa aacagactac ataatactgt aaaacacaac atatccagtc actatggcgg 1560ccgcattagg caccccaggc tttacacttt atgcttccgg ctcgtataat gtgtggattt 1620
tgagttagga tccggcgaga ttttcaggag ctaaggaagc taaaatggag aaaaaaatca 1680ctggatatac caccgttgat atatcccaat ggcatcgtaa agaacatttt gaggcatttc 1740agtcagttgc tcaatgtacc tataaccaga ccgttcagct ggatattacg gcctttttaa 1800agaccgtaaa gaaaaataag cacaagtttt atccggcctt tattcacatt cttgcccgcc 1860tgatgaatgc tcatccggaa ttccgtatgg caatgaaaga cggtgagctg gtgatatggg 1920atagtgttca cccttgttac accgttttcc atgagcaaac tgaaacgttt tcatcgctct 1980ggagtgaata ccacgacgat ttccggcagt ttctacacat atattcgcaa gatgtggcgt 2040gttacggtga aaacctggcc tatttcccta aagggtttat tgagaatatg tttttcgtct 2100cagccaatcc ctgggtgagt ttcaccagtt ttgatttaaa cgtggccaat atggacaact 2160tcttcgcccc cgttttcacc atgggcaaat attatacgca aggcgacaag gtgctgatgc 2220cgctggcgat tcaggttcat catgccgtct gtgatggctt ccatgtcggc agaatgctta 2280atgaattaca acagtactgc gatgagtggc agggcggggc gtaaagatct ggatccggct 2340tactaaaagc cagataacag tatgcgtatt tgcgcgctga tttttgcggt ataagaatat 2400atactgatat gtatacccga agtatgtcaa aaagaggtgt gctatgaagc agcgtattac 2460agtgacagtt gacagcgaca gctatcagtt gctcaaggca tatatgatgt caatatctcc 2520ggtctggtaa gcacaaccat gcagaatgaa gcccgtcgtc tgcgtgccga acgctggaaa 2580gcggaaaatc aggaagggat ggctgaggtc gcccggttta ttgaaatgaa cggctctttt 2640gctgacgaga acagggactg gtgaaatgca gtttaaggtt tacacctata aaagagagag 2700ccgttatcgt ctgtttgtgg atgtacagag tgatattatt gacacgcccg ggcgacggat 2760ggtgatcccc ctggccagtg cacgtctgct gtcagataaa gtctcccgtg aactttaccc 2820ggtggtgcat atcggggatg aaagctggcg catgatgacc accgatatgg ccagtgtgcc 2880ggtctccgtt atcggggaag aagtggctga tctcagccac cgcgaaaatg acatcaaaaa 2940cgccattaac ctgatgttct ggggaatata aatgtcaggc tcccttatac acagccagtc 3000tgcaggtcga ccatagtgac tggatatgtt gtgttttaca gtattatgta gtctgttttt 3060tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcagctt 3120tcttgtacaa agtggttgat tccctcgagg cggccgcggg cgccagtgtg ctggaattaa 3180ttcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctcaaaag cgggcatgac 3240ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 3300ggtgatgcct ttgagggtgg ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc 3360aagcttgagg tgtggcaggc ttgagatctg gccatacact tgagtgacaa tgacatccac 3420tttgcctttc tctccacagg tgtccactcc caggtccaac tgcaggtcga gcatgcatct 3480agggcggcca attccgcccc tctccctccc ccccccctaa cgttactggc cgaagccgct 3540tggaataagg ccggtgtgcg tttgtctata tgtgattttc caccatattg ccgtcttttg 3600gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt 3660cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg 3720aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac 3780ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg 3840cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctctcct 3900caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg 3960atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aaacgtctag 4020gccccccgaa ccacggggac gtggttttcc tttgaaaaac acgatgataa gcttgccaca 4080acccacaagg agacgacctt ccatgaccga gtacaagccc acggtgcgcc tcgccacccg 4140cgacgacgtc ccccgggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac 4200gcgccacacc gtcgacccgg accgccacat cgagcgggtc accgagctgc aagaactctt 4260cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt 4320ggcggtctgg accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc 4380gcgcatggcc gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct 4440ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc accgtcggcg tctcgcccga 4500
ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg 4560cgccggggtg cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg 4620gctcggcttc accgtcaccg ccgacgtcga gtgcccgaag gaccgcgcga cctggtgcat 4680gacccgcaag cccggtgcct gacgcccgcc ccacgacccg cagcgcccga ccgaaaggag 4740cgcacgaccc catggctccg accgaagccg acccgggcgg ccccgccgac cccgcacccg 4800cccccgaggc ccaccgactc tagagctcgc tgatcagcct cgactgtgcc ttctagttgc 4860cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 4920actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 4980attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 5040catgctgggg atgcggtggg ctctatggct tctgaggcgg aaagaaccag ctggggctcg 5100accgatgccc ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac 5160tatcgtcgcc gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgcctgg 5220ccggggtccc ccggaaactc ggccgtggtg accatgcagg aaaaggacaa gcagcgaaaa 5280ttcacgcccc cttgggaggt ggcggcatat gcaaaggata gcactcccac tctactactg 5340ggtatcatat gctgactgta tatgcatgag gatagcatat gctacccgga tacagattag 5400gatagcatat actacccaga tatagattag gatagcatat gctacccaga tatagattag 5460gatagcctat gctacccaga tataaattag gatagcatat actacccaga tatagattag 5520gatagcatat gctacccaga tatagattag gatagcctat gctacccaga tatagattag 5580gatagcatat gctacccaga tatagattag gatagcatat gctatccaga tatttgggta 5640gtatatgcta cccagatata aattaggata gcatatacta ccctaatctc tattaggata 5700gcatatgcta cccggataca gattaggata gcatatacta cccagatata gattaggata 5760gcatatgcta cccagatata gattaggata gcctatgcta cccagatata aattaggata 5820gcatatacta cccagatata gattaggata gcatatgcta cccagatata gattaggata 5880gcctatgcta cccagatata gattaggata gcatatgcta tccagatatt tgggtagtat 5940atgctaccca tggcaacatt agcccaccgt gctctcagcg acctcgtgaa tatgaggacc 6000aacaaccctg tgcttggcgc tcaggcgcaa gtgtgtgtaa tttgtcctcc agatcgcagc 6060aatcgcgccc ctatcttggc ccgcccacct acttatgcag gtattccccg gggtgccatt 6120agtggttttg tgggcaagtg gtttgaccgc agtggttagc ggggttacaa tcagccaagt 6180tattacaccc ttattttaca gtccaaaacc gcagggcggc gtgtgggggc tgacgcgtgc 6240ccccactcca caatttcaaa aaaaagagtg gccacttgtc tttgtttatg ggccccattg 6300gcgtggagcc ccgtttaatt ttcgggggtg ttagagacaa ccagtggagt ccgctgctgt 6360cggcgtccac tctctttccc cttgttacaa atagagtgta acaacatggt tcacctgtct 6420tggtccctgc ctgggacaca tcttaataac cccagtatca tattgcacta ggattatgtg 6480ttgcccatag ccataaattc gtgtgagatg gacatccagt ctttacggct tgtccccacc 6540ccatggattt ctattgttaa agatattcag aatgtttcat tcctacacta gtatttattg 6600cccaaggggt ttgtgagggt tatattggtg tcatagcaca atgccaccac tgaacccccc 6660gtccaaattt tattctgggg gcgtcacctg aaaccttgtt ttcgagcacc tcacatacac 6720cttactgttc acaactcagc agttattcta ttagctaaac gaaggagaat gaagaagcag 6780gcgaagattc aggagagttc actgcccgct ccttgatctt cagccactgc ccttgtgact 6840aaaatggttc actaccctcg tggaatcctg accccatgta aataaaaccg tgacagctca 6900tggggtggga gatatcgctg ttccttagga cccttttact aaccctaatt cgatagcata 6960tgcttcccgt tgggtaacat atgctattga attagggtta gtctggatag tatatactac 7020tacccgggaa gcatatgcta cccgtttagg gttataccgt cgacctctag ctagagcttg 7080gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 7140aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 7200acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg 7260cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 7320tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 7380
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 7440gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 7500aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 7560ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 7620gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 7680ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 7740ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 7800cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 7860attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 7920ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 7980aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 8040gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 8100tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 8160ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 8220taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 8280atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 8340actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 8400cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 8460agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 8520gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 8580gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 8640gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 8700gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagtact gcataattct 8760cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 8820ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 8880accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 8940aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 9000aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 9060caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 9120ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 9180gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 9240cctgacgtc 9249
權(quán)利要求
1.一種鑒定負(fù)責(zé)由起始細(xì)胞分化成靶細(xì)胞的遺傳因子的方法,所述方法包括以下步驟獲得代表在靶細(xì)胞類型中表達(dá)的基因的cDNA文庫;將所述cDNA文庫的拷貝置于將在起始細(xì)胞類型中表達(dá)的表達(dá)載體;將該表達(dá)載體轉(zhuǎn)化入起始細(xì)胞類型的細(xì)胞;培養(yǎng)起始細(xì)胞類型的細(xì)胞直到至少一些細(xì)胞分化;在培養(yǎng)的細(xì)胞中鑒定至少一種已分化成靶細(xì)胞類型的細(xì)胞;以及在已經(jīng)分化的細(xì)胞中鑒定cDNA以鑒定負(fù)責(zé)細(xì)胞分化的遺傳因子。
2.如權(quán)利要求1所述的方法,其特征在于,所述起始細(xì)胞類型是人未分化的干細(xì)胞。
3.如權(quán)利要求1所述的方法,其特征在于,所述表達(dá)載體選自EBV載體和慢病毒載體。
4.如權(quán)利要求1所述的方法,其特征在于,所述起始細(xì)胞還包括一種在組織特異性啟動子控制下的標(biāo)記系統(tǒng),該啟動子使標(biāo)記系統(tǒng)在靶細(xì)胞類型中特異表達(dá),且其中所述鑒定至少一種細(xì)胞的步驟通過鑒定細(xì)胞表達(dá)標(biāo)記系統(tǒng)進(jìn)行。
5.如權(quán)利要求4所述的方法,其特征在于,所述標(biāo)記系統(tǒng)是可選擇標(biāo)記。
6.如權(quán)利要求1所述的方法,其特征在于,所述鑒定cDNA的步驟通過對從分化細(xì)胞回收的DNA進(jìn)行PCR進(jìn)行。
7.一種負(fù)責(zé)從起始細(xì)胞分化成靶細(xì)胞的遺傳因子的鑒定方法,所述方法包括以下步驟在靶細(xì)胞類型的譜系中,從細(xì)胞的mRNA中制備cDNA文庫;將所述cDNA文庫的拷貝置于將在起始細(xì)胞類型中表達(dá)的表達(dá)載體;將該表達(dá)載體轉(zhuǎn)化入起始細(xì)胞類型的細(xì)胞;培養(yǎng)起始細(xì)胞類型的細(xì)胞直到至少一些細(xì)胞分化;在培養(yǎng)的細(xì)胞中鑒定至少一種已分化成靶細(xì)胞類型的細(xì)胞;以及在已經(jīng)分化的細(xì)胞中鑒定cDNA以鑒定負(fù)責(zé)細(xì)胞分化的遺傳因子。
8.如權(quán)利要求7所述的方法,其特征在于,所述起始細(xì)胞類型是人未分化的干細(xì)胞。
9.如權(quán)利要求7所述的方法,其特征在于,所述表達(dá)載體選自EBV載體和慢病毒載體。
10.如權(quán)利要求7所述的方法,其特征在于,所述起始細(xì)胞包括一種在組織特異性啟動子控制下的標(biāo)記系統(tǒng),該啟動子使標(biāo)記系統(tǒng)在靶細(xì)胞類型中特異表達(dá),且其中所述鑒定至少一種細(xì)胞的步驟通過鑒定細(xì)胞表達(dá)標(biāo)記系統(tǒng)進(jìn)行。
11.如權(quán)利要求10所述的方法,其特征在于,所述標(biāo)記系統(tǒng)是可選擇標(biāo)記。
12.如權(quán)利要求7所述的方法,其特征在于,所述鑒定cDNA的步驟通過對從分化細(xì)胞回收的DNA進(jìn)行PCR進(jìn)行。
全文摘要
描述了負(fù)責(zé)基于表達(dá)克隆的細(xì)胞分化的遺傳因子的鑒定方法。為確定那一種遺傳因子導(dǎo)致細(xì)胞從起始細(xì)胞類型分化成靶細(xì)胞類型,獲得了一種cDNA文庫,將其包裝在表達(dá)載體中并轉(zhuǎn)化入起始細(xì)胞類型的細(xì)胞。表達(dá)載體還優(yōu)選包括一種標(biāo)記基因系統(tǒng),所述系統(tǒng)在靶細(xì)胞類型的組織類型中可操作的組織特異性啟動子的控制下。然后培養(yǎng)轉(zhuǎn)化的細(xì)胞直到細(xì)胞分化開始,然后篩選或選擇培養(yǎng)物以鑒定分化成靶細(xì)胞類型的細(xì)胞。通過檢測分化細(xì)胞中的cDNA插入物可鑒定負(fù)責(zé)分化過程的遺傳因子。
文檔編號C12N15/867GK1643142SQ03806072
公開日2005年7月20日 申請日期2003年3月14日 優(yōu)先權(quán)日2002年3月15日
發(fā)明者J·A·湯姆森 申請人:威斯康星校友研究基金會