亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

具有抑制癌細(xì)胞生長(zhǎng)功能的新的人蛋白及其編碼序列的制作方法

文檔序號(hào):852775閱讀:458來源:國(guó)知局
專利名稱:具有抑制癌細(xì)胞生長(zhǎng)功能的新的人蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于生物技術(shù)領(lǐng)域,具體地說,本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
人基因組學(xué)研究目前是國(guó)際上的熱點(diǎn),除人染色體DNA大規(guī)模測(cè)序,表達(dá)序列測(cè)序(EST)的方法外,還缺少?gòu)墓δ荛_始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預(yù)防腫瘤,目前人們已越來越關(guān)注腫瘤的基因治療。因此,本領(lǐng)域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動(dòng)劑/抑制劑。
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有抑癌功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性;(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補(bǔ)的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14。更佳地,該多核苷酸的序列選自下組SEQ ID NO:3、SEQ IDNO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15的編碼區(qū)序列或全長(zhǎng)序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
在本發(fā)明的第四方面,提供了制備具有抑癌功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達(dá)具有抑癌功能的蛋白的條件下,培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞;(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有抑癌功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測(cè)的核酸分子,它含有上述的多核苷酸中連續(xù)的10-800個(gè)核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學(xué)上可接受的載體。這些藥物組合物可治療癌癥以及細(xì)胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的技術(shù)的公開,對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染癌細(xì)胞,在獲得具有抑癌作用的基礎(chǔ)上,經(jīng)測(cè)序證明為新的基因,進(jìn)一步得到全長(zhǎng)cDNA克隆。DNA轉(zhuǎn)染試驗(yàn)證明,本發(fā)明的具有抑癌功能的蛋白對(duì)癌細(xì)胞(肝癌細(xì)胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細(xì)胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標(biāo)準(zhǔn)的蛋白質(zhì)純化技術(shù)純化具有抑癌功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。具有抑癌功能的蛋白多肽的純度能用氨基酸序列分析。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學(xué)合成的產(chǎn)物,或使用重組技術(shù)從原核或真核宿主(例如,細(xì)菌、酵母、高等植物、昆蟲和哺乳動(dòng)物細(xì)胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用,術(shù)語(yǔ)“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學(xué)功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(ⅰ)有一個(gè)或多個(gè)保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ⅱ)在一個(gè)或多個(gè)氨基酸殘基中具有取代基團(tuán)的多肽,或(ⅲ)成熟多肽與另一個(gè)化合物(比如延長(zhǎng)多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(ⅳ)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導(dǎo)序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導(dǎo),這些片段、衍生物和類似物屬于本領(lǐng)域熟練技術(shù)人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以SP24蛋白(在本申請(qǐng)中,蛋白質(zhì)的命名采用其克隆編號(hào))為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO:3所示的編碼區(qū)序列相同或者是簡(jiǎn)并的變異體。如本文所用,“簡(jiǎn)并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO:2的蛋白質(zhì),但與SEQ ID NO:3所示的編碼區(qū)序列有差別的核酸序列。以PP13蛋白(在本申請(qǐng)中,蛋白質(zhì)的命名采用其克隆編號(hào))為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO:6所示的編碼區(qū)序列相同或者是簡(jiǎn)并的變異體。如本文所用,“簡(jiǎn)并的變異體”在本發(fā)明中是指編碼具有SEQ IDNO:5的蛋白質(zhì),但與SEQID NO:6所示的編碼區(qū)序列有差別的核酸序列。對(duì)于其他具有抑癌功能的蛋白,可依此類推。對(duì)于其他具有抑癌功能的蛋白,可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術(shù)語(yǔ)“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域所知的,等位變異體是一個(gè)多核苷酸的替換形式,它可能是一個(gè)或多個(gè)核苷酸的取代、缺失或插入,但不會(huì)從實(shí)質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個(gè)序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴(yán)格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴(yán)格條件”是指(1)在較低離子強(qiáng)度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時(shí)加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時(shí)才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO:2所示的成熟多肽有相同的生物學(xué)功能和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長(zhǎng)度至少含15個(gè)核苷酸,較好是至少30個(gè)核苷酸,更好是至少50個(gè)核苷酸,最好是至少100個(gè)核苷酸以上。核酸片段可用于核酸的擴(kuò)增技術(shù)(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領(lǐng)域熟知的雜交技術(shù)分離DNA。這些技術(shù)包括但不局限于1)用探針與基因組或cDNA文庫(kù)雜交以檢出同源性核苷酸序列,和2)表達(dá)文庫(kù)的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學(xué)合成DNA序列以獲得所需多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。當(dāng)需要的多肽產(chǎn)物的整個(gè)氨基酸序列已知時(shí),DNA序列的直接化學(xué)合成是經(jīng)常選用的方法。如果所需的氨基酸的整個(gè)序列不清楚時(shí),DNA序列的直接化學(xué)合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標(biāo)準(zhǔn)方法是從高表達(dá)該基因的供體細(xì)胞分離mRNA并進(jìn)行逆轉(zhuǎn)錄,形成質(zhì)?;蚴删wcDNA文庫(kù)。提取mRNA的方法已有多種成熟的技術(shù),試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫(kù)也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應(yīng)的cDNA文庫(kù),如Clontech公司的不同cDNA文庫(kù)。當(dāng)結(jié)合使用聚合酶反應(yīng)技術(shù)時(shí),即使極少的表達(dá)產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫(kù)中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標(biāo)志基因的功能出現(xiàn)或喪失;(3)測(cè)定具有抑癌功能的蛋白的轉(zhuǎn)錄本的水平;(4)通過免疫學(xué)技術(shù)或測(cè)定生物學(xué)活性,來檢測(cè)基因表達(dá)的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應(yīng)用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長(zhǎng)度至少15個(gè)核苷酸,較好是至少30個(gè)核苷酸,更好是至少50個(gè)核苷酸,最好是至少100個(gè)核苷酸。此外,探針的長(zhǎng)度通常在2kb之內(nèi),較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎(chǔ)上化學(xué)合成的DNA序列。本發(fā)明的基因本身或者片段當(dāng)然可以用作探針。DNA探針的標(biāo)記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測(cè)具有抑癌功能的蛋白基因表達(dá)的蛋白產(chǎn)物可用免疫學(xué)技術(shù)如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應(yīng)用PCR技術(shù)擴(kuò)增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫(kù)中得到全長(zhǎng)的cDNA時(shí),可優(yōu)選使用RACE法(RACE-cDNA末端快速擴(kuò)增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當(dāng)?shù)剡x擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴(kuò)增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測(cè)定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,74:5463-5467)。這類核苷酸序列測(cè)定也可用商業(yè)測(cè)序試劑盒等。為了獲得全長(zhǎng)的cDNA序列,測(cè)序需反復(fù)進(jìn)行。有時(shí)需要測(cè)定多個(gè)克隆的cDNA序列,才能拼接成全長(zhǎng)的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或具有抑癌功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細(xì)胞,以及經(jīng)重組技術(shù)產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(shù),可利用本發(fā)明的多聚核苷酸序列可用來表達(dá)或生產(chǎn)重組的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般來說有以下步驟(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達(dá)載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)合適的宿主細(xì)胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細(xì)胞;(3).從培養(yǎng)基或細(xì)胞中分離、純化蛋白質(zhì)。
本發(fā)明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達(dá)載體中。術(shù)語(yǔ)“重組表達(dá)載體”指本領(lǐng)域熟知的細(xì)菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細(xì)胞病毒、哺乳動(dòng)物細(xì)胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細(xì)菌中表達(dá)的基于T7的表達(dá)載體(Rosenberg,et al.Gene,1987,56:125);在哺乳動(dòng)物細(xì)胞中表達(dá)的pMSXND表達(dá)載體(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆蟲細(xì)胞中表達(dá)的來源于桿狀病毒的載體??傊?,只要能在宿主體內(nèi)復(fù)制和穩(wěn)定,任何質(zhì)粒和載體都可以用。表達(dá)載體的一個(gè)重要特征是通常含有復(fù)制起點(diǎn)、啟動(dòng)子、標(biāo)記基因和翻譯控制元件。
本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號(hào)的表達(dá)載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi)重組技術(shù)等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,coldSpring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達(dá)載體中的適當(dāng)啟動(dòng)子上,以指導(dǎo)mRNA合成。這些啟動(dòng)子的代表性例子有大腸桿菌的lac或trp啟動(dòng)子;λ噬菌體PL啟動(dòng)子;真核啟動(dòng)子包括CMV立即早期啟動(dòng)子、HSV胸苷激酶啟動(dòng)子、早期和晚期SV40啟動(dòng)子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細(xì)胞或其病毒中表達(dá)的啟動(dòng)子。表達(dá)載體還包括翻譯起始用的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。
此外,表達(dá)載體優(yōu)選地包含一個(gè)或多個(gè)選擇性標(biāo)記基因,以提供用于選擇轉(zhuǎn)化的宿主細(xì)胞的表型性狀,如真核細(xì)胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當(dāng)DNA序列以及適當(dāng)啟動(dòng)子或者控制序列的載體,可以用于轉(zhuǎn)化適當(dāng)?shù)乃拗骷?xì)胞,以使其能夠表達(dá)蛋白質(zhì)。
宿主細(xì)胞可以是原核細(xì)胞,如細(xì)菌細(xì)胞;或是低等真核細(xì)胞,如酵母細(xì)胞;或是高等真核細(xì)胞,如哺乳動(dòng)物細(xì)胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細(xì)菌細(xì)胞;真菌細(xì)胞如酵母;植物細(xì)胞;果蠅S2或Sf9的昆蟲細(xì)胞;CHO、COS或Bowes黑素瘤細(xì)胞的動(dòng)物細(xì)胞等。
本發(fā)明的多核苷酸在高等真核細(xì)胞中表達(dá)時(shí),如果在載體中插入增強(qiáng)子序列時(shí)將會(huì)使轉(zhuǎn)錄得到增強(qiáng)。增強(qiáng)子是DNA的順式作用因子,通常大約有10到300個(gè)堿基對(duì),作用于啟動(dòng)子以增強(qiáng)基因的轉(zhuǎn)錄??膳e的例子包括在復(fù)制起始點(diǎn)晚期一側(cè)的100到270個(gè)堿基對(duì)的SV40增強(qiáng)子、在復(fù)制起始點(diǎn)晚期一側(cè)的多瘤增強(qiáng)子以及腺病毒增強(qiáng)子等。
本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當(dāng)?shù)妮d體、啟動(dòng)子、增強(qiáng)子和宿主細(xì)胞。
用重組DNA轉(zhuǎn)化宿主細(xì)胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進(jìn)行。當(dāng)宿主為原核生物如大腸桿菌時(shí),能吸收DNA的感受態(tài)細(xì)胞可在指數(shù)生長(zhǎng)期后收獲,用CaCl2法處理,所用的步驟在本領(lǐng)域眾所周知。可供選擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進(jìn)行。當(dāng)宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,常規(guī)機(jī)械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達(dá)本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細(xì)胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細(xì)胞生長(zhǎng)的條件下進(jìn)行培養(yǎng)。當(dāng)宿主細(xì)胞生長(zhǎng)到適當(dāng)?shù)募?xì)胞密度后,用合適的方法(如溫度轉(zhuǎn)換或化學(xué)誘導(dǎo))誘導(dǎo)選擇的啟動(dòng)子,將細(xì)胞再培養(yǎng)一段時(shí)間。
在上面的方法中的重組多肽可包被于細(xì)胞內(nèi)、細(xì)胞外或在細(xì)胞膜上表達(dá)或分泌到細(xì)胞外。如果需要,可利用其物理的、化學(xué)的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領(lǐng)域技術(shù)人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復(fù)性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病,和用于篩選促進(jìn)或?qū)咕哂幸职┕δ艿牡鞍坠δ艿目贵w、多肽或其它配體。例如,抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達(dá)的重組具有抑癌功能的人蛋白篩選多肽庫(kù)可用于尋找有治療價(jià)值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動(dòng)劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動(dòng)劑提高具有抑癌功能的人蛋白刺激細(xì)胞增殖等生物功能,而拮抗劑阻止和治療與細(xì)胞過度增殖有關(guān)的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動(dòng)物細(xì)胞或表達(dá)具有抑癌功能的人蛋白的膜制劑與標(biāo)記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測(cè)定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有抑癌功能的人蛋白的拮抗劑可以與具有抑癌功能的人蛋白結(jié)合并消除其功能,或是抑制具有抑癌功能的人蛋白的產(chǎn)生,或是與多肽的活性位點(diǎn)結(jié)合使多肽不能發(fā)揮生物學(xué)功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時(shí),可以將具有抑癌功能的蛋白加入生物分析測(cè)定中,通過測(cè)定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細(xì)胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細(xì)胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動(dòng)物的方法得到。制備單克隆抗體的技術(shù)包括雜交瘤技術(shù),三瘤技術(shù),人B-細(xì)胞雜交瘤技術(shù),EBV-雜交瘤技術(shù)等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機(jī)構(gòu)所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機(jī)構(gòu)許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預(yù)防具體的適應(yīng)癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的。基因治療技術(shù)可用于治療由于具有抑癌功能的蛋白的無表達(dá)或異常/無活性的具有抑癌功能的蛋白的表達(dá)所致的細(xì)胞增殖、發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設(shè)計(jì)成表達(dá)變異的具有抑癌功能的蛋白,以抑制內(nèi)源性的具有抑癌功能的蛋白活性。例如,一種變異的具有抑癌功能的蛋白可以是縮短的、缺失了信號(hào)傳導(dǎo)功能域的具有抑癌功能的蛋白,雖可與下游的底物結(jié)合,但缺乏信號(hào)傳導(dǎo)活性。因此重組的基因治療載體可用于治療具有抑癌功能的蛋白表達(dá)或活性異常所致的疾病。來源于病毒的表達(dá)載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關(guān)病毒、單純皰疹病毒、細(xì)小病毒等可用于將具有抑癌功能的蛋白基因轉(zhuǎn)移至細(xì)胞內(nèi)。構(gòu)建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(xiàn)(Sambrook,et al.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細(xì)胞內(nèi)。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機(jī)制是核酶分子與互補(bǔ)的靶RNA特異性雜交后進(jìn)行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術(shù)獲得,如固相磷酸酰胺化學(xué)合成法合成寡核苷酸的技術(shù)已廣泛應(yīng)用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動(dòng)子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對(duì)其進(jìn)行修飾,如增加兩側(cè)的序列長(zhǎng)度,核糖核苷之間的連接應(yīng)用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導(dǎo)入組織或細(xì)胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導(dǎo)入細(xì)胞中,再將細(xì)胞移植到體內(nèi)等。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學(xué)或酶進(jìn)行特異性切割,并進(jìn)行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對(duì)具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達(dá)文庫(kù)產(chǎn)生的片段。
抗具有抑癌功能的人蛋白的抗體可用于免疫組織化學(xué)技術(shù)中,檢測(cè)活檢標(biāo)本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標(biāo)記,注入體內(nèi)可跟蹤其位置和分布。這種放射性標(biāo)記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細(xì)胞的定位和判斷是否有轉(zhuǎn)移。
本發(fā)明中的抗體可用于治療或預(yù)防與具有抑癌功能的人蛋白相關(guān)的疾病。給予適當(dāng)劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產(chǎn)生或活性。
抗體也可用于設(shè)計(jì)針對(duì)體內(nèi)某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細(xì)菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價(jià)結(jié)合。一種通常的方法是用巰基交聯(lián)劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結(jié)合于抗體上,這種雜交抗體可用于殺滅具有抑癌功能的人蛋白陽(yáng)性的細(xì)胞。
多克隆抗體的生產(chǎn)可用具有抑癌功能的人蛋白或多肽免疫動(dòng)物,如家兔,小鼠,大鼠等。多種佐劑可用于增強(qiáng)免疫反應(yīng),包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術(shù)生產(chǎn)(Kohler and Milstein.Nature,1975,256:495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術(shù)生產(chǎn)(Morrison et al,PNAS,1985,81:6851)。而已有的生產(chǎn)單鏈抗體的技術(shù)(U.S.PatNo.4946778)也可用于生產(chǎn)抗具有抑癌功能的人蛋白的單鏈抗體。
能與具有抑癌功能的人蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機(jī)多肽庫(kù)而獲得。篩選時(shí),必須對(duì)具有抑癌功能的人蛋白分子進(jìn)行標(biāo)記。
本發(fā)明還涉及定量和定位檢測(cè)具有抑癌功能的人蛋白水平的診斷試驗(yàn)方法。這些試驗(yàn)是本領(lǐng)域所熟知的,且包括FISH測(cè)定和放射免疫測(cè)定。試驗(yàn)中所檢測(cè)的具有抑癌功能的人蛋白水平,可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關(guān)疾病的診斷和治療。在診斷方面,具有抑癌功能的蛋白的多聚核苷酸可用于檢測(cè)具有抑癌功能的蛋白的表達(dá)與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達(dá)。如具有抑癌功能的蛋白DNA序列可用于對(duì)活檢標(biāo)本的雜交以判斷具有抑癌功能的蛋白的表達(dá)異常。雜交技術(shù)包括Southern印跡法,Northern印跡法、原位雜交等。這些技術(shù)方法都是公開的成熟技術(shù),相關(guān)的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達(dá)分析和基因診斷。用具有抑癌功能的蛋白特異的引物進(jìn)行RNA-聚合酶鏈反應(yīng)(RT-PCR)體外擴(kuò)增也可檢測(cè)具有抑癌功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測(cè)具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關(guān)的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點(diǎn)突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g(shù)如Southern印跡法、DNA序列分析、PCR和原位雜交檢測(cè)突變。另外,突變有可能影響蛋白的表達(dá),因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對(duì)染色體鑒定也是有價(jià)值的。該序列會(huì)特異性地針對(duì)某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點(diǎn)?,F(xiàn)在,只有很少的基于實(shí)際序列數(shù)據(jù)(重復(fù)多態(tài)性)的染色體標(biāo)記物可用于標(biāo)記染色體位置。根據(jù)本發(fā)明,為了將這些序列與疾病相關(guān)基因相關(guān)聯(lián),其重要的第一步就是將這些DNA序列定位于染色體上。
簡(jiǎn)而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細(xì)胞雜合細(xì)胞。只有那些含有相應(yīng)于引物的人基因的雜合細(xì)胞會(huì)產(chǎn)生擴(kuò)增的片段。
體細(xì)胞雜合細(xì)胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實(shí)現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標(biāo)記的流式分選的染色體預(yù)篩選和雜交預(yù)選,從而構(gòu)建染色體特異的cDNA庫(kù)。
將cDNA克隆與中期染色體進(jìn)行熒光原位雜交(FISH),可以在一個(gè)步驟中精確地進(jìn)行染色體定位。此技術(shù)的綜述,參見Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準(zhǔn)確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關(guān)聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機(jī)獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關(guān)系。
接著,需要測(cè)定患病和未患病個(gè)體間的cDNA或基因組序列差異。如果在一些或所有的患病個(gè)體中觀察到某突變,而該突變?cè)谌魏握€(gè)體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個(gè)體,通常涉及首先尋找染色體中結(jié)構(gòu)的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測(cè)的缺失或易位。根據(jù)目前的物理作圖和基因定位技術(shù)的分辨能力,被精確定位至與疾病有關(guān)的染色體區(qū)域的cDNA,可以是50至500個(gè)潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對(duì)應(yīng)于一個(gè)基因)。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長(zhǎng)序列或其片段通??梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計(jì)引物,并用市售的cDNA庫(kù)或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫(kù)作為模板,擴(kuò)增而得有關(guān)序列。當(dāng)序列較長(zhǎng)時(shí),常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長(zhǎng)度較短時(shí)。通常,通過先合成多個(gè)小片段,然后再進(jìn)行連接可獲得序列很長(zhǎng)的片段。
目前,已經(jīng)可以完全通過化學(xué)合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領(lǐng)域中的各種DNA分子(如載體)和細(xì)胞中。此外,還可通過化學(xué)合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預(yù)計(jì)在施用于人時(shí)將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1:cDNA基因的獲得及對(duì)癌細(xì)胞克隆形成的抑制作用SP24來自于從GIBCO BRL公司購(gòu)得的肝cDNA文庫(kù)(cat,No.10422-012),PP13,PP578,PP905,PP1579是通過用常規(guī)方法構(gòu)建的人胎盤cDNA文庫(kù)而獲得。方法如下取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純?cè)噭┖?Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫(kù)構(gòu)建試劑盒(Stratagene公司)構(gòu)建上述mRNA的cDNA文庫(kù)。其中反轉(zhuǎn)錄酶改用MMLV-RT-SuperscriptⅡ(GIBCO BRL),反轉(zhuǎn)錄反應(yīng)在42℃進(jìn)行。轉(zhuǎn)化XL 10-Gold感受細(xì)胞,獲得了1×106cfu/μg cDNA滴度的cDNA文庫(kù)。第一輪隨機(jī)挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑癌細(xì)胞生長(zhǎng)功能的cDNA克隆為探針,雜交篩選cDNA文庫(kù),挑取弱陽(yáng)性及陰性克隆。用Qiagen96孔板質(zhì)粒抽提試劑盒,按廠家說明書進(jìn)行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時(shí)轉(zhuǎn)染肝癌細(xì)胞系7721。100ngDNA酒精沉淀干燥后,加6μlH2O溶解,待轉(zhuǎn)染。每份DNA樣品中加0.74μl脂質(zhì)體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長(zhǎng)于96孔板的7721細(xì)胞中,37℃放置2小時(shí),每孔再加50μl無血清培液,37℃ 24小時(shí)。每孔換100μl全培液,37℃ 24小時(shí),換含G418的全培液100μl,37℃ 24~48小時(shí),邊觀察,邊換G418濃度不等的培液。約2~3次后,直到鏡檢細(xì)胞有克隆形成,計(jì)數(shù)。發(fā)現(xiàn)以上克隆有抑制細(xì)胞克隆形成作用,結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細(xì)胞(7721)克隆形成情況
對(duì)cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動(dòng)測(cè)序儀上測(cè)定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進(jìn)行另一端測(cè)序。如仍未獲得全長(zhǎng)cDNA序列,則設(shè)計(jì)引物,再次進(jìn)行測(cè)序,直到獲得全長(zhǎng)序列(SEQ ID NO:1、4、7、10、13)。
實(shí)施例2從胎盤cDNA中PCR獲得全長(zhǎng)基因取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純?cè)噭┖?pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptⅡ(GIBCO BRL)反轉(zhuǎn)錄酶在42℃進(jìn)行反轉(zhuǎn)錄反應(yīng),獲得胎盤cDNA。利用各個(gè)基因的轉(zhuǎn)異引物(如下表所示),按90℃ 3分鐘1個(gè)循環(huán);94℃ 30秒,60℃ 30秒,72℃ 1分鐘,共35個(gè)循環(huán);72℃ 10分鐘,1個(gè)循環(huán)進(jìn)行PCR擴(kuò)增,獲得含有完整開放閱讀框序列的各蛋白基因的擴(kuò)增產(chǎn)物。擴(kuò)增產(chǎn)物經(jīng)測(cè)序驗(yàn)證,與實(shí)施例1測(cè)得的序列相符,隨后用常規(guī)技術(shù)將擴(kuò)增產(chǎn)物轉(zhuǎn)入宿主細(xì)胞,獲得重組蛋白。
基因特異引物
實(shí)施例3:cDNA克隆序列分析1.SP24蛋白A核苷酸序列SP24(SEQ ID NO:1)長(zhǎng)度1738bp1 TTCTTGGGGT CTTGGCTGTG CACGCCCCAA TAAGCCTGGT GTCTATGTTC51 GTGTTTCAAG GTTTGTTACT TGGATTGAGG GAGTGATGAG AAATAATTAA101 TTGGACGGGA GACAGAGTGA CGCACTGACT CACCTAGAGG CTGGGACGTG151 GGTAGGGATT TAGCATGCTG GAAATAACTG GCAGTAATCA AACGAAGACA201 CTGTCCCCAG CTACCAGCTA CGCCAAACCT CGGCATTTTT TGTGTTATTT251 TCTGACTGCT GGATTCTGTA GTAAGGTGAC ATAGCTATGA CATTTGTTAA301 AAATAAACTC TGTACTTAAC TTTGATTTGA ATAAAAAAAA GGCCAAACAA351 GTTTTAGA4C CTCTACTGGC TGATGCCAAC ATCATCAGAG ATGAACTGTT401 CTTACCAGAA ACTTCTCTGC TCCTGACACC CCACCTCTCC CCAGAAGAGA451 AGAAGGAGAG TGGCCACGTT GATTCAGCCA AGCACCTCCA GGAGGTCCCC501 TCTGGATGTC CCATGAGGCT GCCCCTCAGC CACAGCCCAG AGCACGTGGA551 GATGGCTTTG CTCAGCAACA TCCTAGCGGC CTATTCCTTT GTCTCAGAAA601 ATCCTGAGCG AGCAGCTCTG TGCTTTGTTT CTGGCGTGTG CATCGGGCTG651 GTGCTGACCC TGGCTGCTCT GGTGATAAGG ATCTCTTGCC ACACAGACTG701 CAGGCGGCGT CCCGGGAAGA AGTTCCTGCA GGACAGAGAG AGCAGCAGCG751 ACAGCAGCGA CAGCGAGGAT GGCAGTGAGG ACACCGTGTC CGATCTCTCC801 GTGCGGAGAC ACCGCCGCTT CGAGAGGACT TTGAACAAGA ATGTGTTCAC851 CTCTGCGGAG GAGCTGGAGC GCGCCCAGCG GCTGGAGGAG CGCGAGCGCA901 TCATCAGGGA GATCTGGATG AATGGCCAGC CTGAGGTGCC CGGGACCAGG951 AGCCTGAATC GCTACTATTA GGGAGCAGCA GGACCCCGGA AACCACTGGA1001 GGCCGCCTGG AAAGAGAGCG TCTGCAGGGA CAGTGGGCAC AAGGAACTGA1051 ACCCAGCTCT GCTAATATTG TGATTTCAGA GAAAAAGCAG GACATGCCCC1101 TTTTCTAGCC AGGAGGATTG CTCCTTTTTG GCCAAATGTA TGGAGAAGTA1151 GAAAAATCAA AGCAGTTCAT CACCCTTTCC AGGTCTCGGA ATGGTGCTGA1201 AAAATCCTCT CCAACACTGT GGATGGAGAT CGGAGAAACG CGACTGTGGT1251 TTCTCTTGAT TTCTGAGGAT CTCAGAAGTT TCAGCAGACT TCCTTGCTCT1301 GTGTTATTCC TTTGCAAAAG GAAAGATCAT TATAGCATGA GGGCTGGGAA1351 TAGCAGGGTG AACTTAACCC AATAAATGCA ATTTCCTAAA TGACTTCATG1401 CTATGGAGGT GATTCTGATT CAAATAGCAT GATCCATGCT TATTATTTAA1451 GGCTGATTTT TAAAATCTTG TGTTGCAAGG GCAACCTCGT CCATTTTAAC1501 TGGCACCTCA GGGATTAAAA TCCTACTTTT TAGTGTAGTT CCCACCTCAT1551 TCATGAAAAT GAATAGAACT ATTGTATTAT GGGAGATGTG TCAGTGAACT1601 AGAAAATGTC AATAACCTCA AAGGATGAAG GGTTTTTATT TTAAATAGTT1651 TATAAAATAT ATATTGACAT GCATATTTGA AAATGCTGCA TAAAAATAAA1701 AGTGGTGTGT TTTCAAAAAA AAAAAAAAAA AAAAAAAAB.氨基酸序列SP24(SEQ ID NO:2)長(zhǎng)度152個(gè)氨基酸1 MRLPLSHSPE HVEMALLSNI LAAYSFVSEN PERAALCFVS GVCIGLVLTL51 AALVIRISCH TDCRRRPGKK FLQDRESSSD SSDSEDGSED TVSDLSVRRH101 RRFERTLNKN VFTSAEELER AQRLEERERI IREIWMNGQP EVPGTRSLNR151 YYC.核苷酸及氨基酸組合序列(SEQ ID NO:3)克 隆 號(hào)SP24起始編碼子513 ATG終止編碼子971 TAG蛋白質(zhì)分子量17408.711 TT CTT GGG GTC TTG GCT GTG CAC GCC CCA ATA AGC CTG GTG TCT ATG 4748 TTC GTG TTT CAA GGT TTG TTA CTT GGA TTG AGG GAG TGA TGA GAA ATA 9596 ATT AAT TGG ACG GGA GAC AGA GTG ACG CAC TGA CTC ACC TAG AGG CTG 143144 GGA CGT GGG TAG GGA TTT AGC ATG CTG GAA ATA ACT GGC AGT AAT CAA 191192 ACG AAG ACA CTG TCC CCA GCT ACC AGC TAC GCC AAA CCT CGG CAT TTT 239240 TTG TGT TAT TTT CTG ACT GCT GGA TTC TGT AGT AAG GTG ACA TAG CTA 287288 TGA CAT TTG TTA AAA ATA AAC TCT GTA CTT AAC TTT GAT TTG AAT AAA 335336 AAA AAG GCC AAA CAA GTT TTA GAA CCT CTA CTG GCT GAT GCC AAC ATC 383384 ATC AGA GAT GAA CTG TTC TTA CCA GAA ACT TCT CTG CTC CTG ACA CCC 431432 CAC CTC TCC CCA GAA GAG AAG AAG GAG AGT GGC CAC GTT GAT TCA GCC 479480 AAG CAC CTC CAG GAG GTC CCC TCT GGA TGT CCC ATG AGG CTG CCC CTC 5271 Met Arg Leu Pro Leu 5528 AGC CAC AGC CCA GAG CAC GTG GAG ATG GCT TTG CTC AGC AAC ATC CTA 5756 Ser His Ser Pro Glu His Val Glu Met Ala Leu Leu Ser Asn Ile Leu 21576 GCG GCC TAT TCC TTT GTC TCA GAA AAT CCT GAG CGA GCA GCT CTG TGC 62322 Ala Ala Tyr Ser Phe Val Ser Glu Ash Pro Glu Arg Ala Ala Leu Cys 37624 TTT GTT TCT GGC GTG TGC ATC GGG CTG GTG CTG ACC CTG GCT GCT CTG 67138 Phe Val Ser Gly Val Cys Ile Gly Leu Val Leu Thr Leu Ala Ala Leu 53672 GTG ATA AGG ATC TCT TGC CAC ACA GAC TGC AGG CGG CGT CCC GGG AAG 71954 Val Ile Arg Ile Ser Cys His Thr Asp Cys Arg Arg Arg Pro Gly Lys 69720 AAG TTC CTG CAG GAC AGA GAG AGC AGC AGC GAC AGC AGC GAC AGC GAG 76770 Lys Phe Leu Gln Asp Arg Glu Ser Ser Ser Asp Ser Ser Asp Ser Glu 85768 GAT GGC AGT GAG GAC ACC GTG TCC GAT CTC TCC GTG CGG AGA CAC CGC 81586 Asp Gly Ser Glu Asp Thr Val Ser Asp Leu Ser Val Arg Arg His Arg 101816 CGC TTC GAG AGG ACT TTG AAC AAG AAT GTG TTC ACC TCT GCG GAG GAG 863102 Arg Phe Glu Arg Thr Leu Asn Lys Asn Val Phe Thr Ser Ala Glu Glu 117864 CTG GAG CGC GCC CAG CGG CTG GAG GAG CGC GAG CGC ATC ATC AGG GAG 911118 Leu Glu Arg Ala Gln Arg Leu Glu Glu Arg Glu Arg Ile Ile Arg Glu 133912 ATC TGG ATG AAT GGC CAG CCT GAG GTG CCC GGG ACC AGG AGC CTG AAT 959134 Ile Trp Met Asn Gly Gln Pro Glu Val Pro Gly Thr Arg Ser Leu Asn 149960 CGC TAC TAT TAG GGA GCA GCA GGA CCC CGG AAA CCA CTG GAG GCC GCC1007150 Arg Tyr Tyr *** 1531008 TGG AAA GAG AGC GTC TGC AGG GAC AGT GGG CAC AAG GAA CTG AAC CCA10551056 GCT CTG CTA ATA TTG TGA TTT CAG AGA AAA AGC AGG ACA TGC CCC TTT11031104 TCT AGC CAG GAG GAT TGC TCC TTT TTG GCC AAA TGT ATG GAG AAG TAG11511152 AAA AAT CAA AGC AGT TCA TCA CCC TTT CCA GGT CTC GGA ATG GTG CTG11991200 AAA AAT CCT CTC CAA CAC TGT GGA TGG AGA TCG GAG AAA CGC GAC TGT12471248 GGT TTC TCT TGA TTT CTG AGG ATC TCA GAA GTT TCA GCA GAC TTC CTT12951296 GCT CTG TGT TAT TCC TTT GCA AAA GGA AAG ATC ATT ATA GCA TGA GGG13431344 CTG GGA ATA GCA GGG TGA ACT TAA CCC AAT AAA TGC AAT TTC CTA AAT13911392 GAC TTC ATG CTA TGG AGG TGA TTC TGA TTC AAA TAG CAT GAT CCA TGC14391440 TTA TTA TTT AAG GCT GAT TTT TAA AAT CTT GTG TTG CAA GGG CAA CCT14871488 CGT CCA TTT TAA CTG GCA CCT CAG GGA TTA AAA TCC TAC TTT TTA GTG15351536 TAG TTC CCA CCT CAT TCA TGA AAA TGA ATA GAA CTA TTG TAT TAT GGG15831584 AGA TGT GTC AGT GAA CTA GAA AAT GTC AAT AAC CTC AAA GGA TGA AGG16311632 GTT TTT ATT TTA AAT AGT TTA TAA AAT ATA TAT TGA CAT GCA TAT TTG16791680 AAA ATG CTG CAT AAA AAT AAA AGT GGT GTG TTT TCA AAA AAA AAA AAA17271728 AAA AAA AAA AA 17382.PP13蛋白A核苷酸序列(SEQ ID NO:4)長(zhǎng)度1784bp1 TGGTGGCGCA TGTCTGTAAT CCCAGCTACT CGGGAAGCTG AGGCAGGAGA51 ATCGCTTGAA CCCAGGAAGC GGAGGTTGCA GTGAGCCGAG ATCGCGCCAC101 TGCACTCCAA CCTGGGCAAC AATACAAGAC TCCATCTGAA AAAAAAAAGA151 TCACACAGGA AAACAGAAGT TCGATTTTAC GTCGTACACT GCTGTAATTT201 CAGCACATGT GGACTCGTGT AACCAACACC ATAACCTTCC ATCACCCCTG251 AAACTCCCTC CCGCCAGCCC TTTAGGGTTG CCCCTCCCCC CGAACCCCAC301 CAGCCCCTGG TGACCACTGA TCTGTCCTCC AACCCATAGT GTTTTTCCGG351 GAATGTCACA AAAACAGAAG CCGACCATGG GTCACCTTTC TGGCGCCTTT401 CTCCCCGCAC AAAGTCTTTG TCCTTGTGAA GTTGTRACGT GCCAAACGCT451 TGTCCCTTTT TCCTGCTGGG TAATACTCCC GGTGCCGCCC TTGCTGTTCG501 TCGATGCACA TCTGGCTGCT TTTCGCTGGC TGCGAGCGGA GCTGCTAGGG551 ACATGGCCAC GGGGCTGTGA GAGCGGAGTT TCCTCTCTCC GGTGACCCTG601 AGCTGCGCCT TTCTCAGCCG CCTCCCGAGG CCCCAGGCGC TCTGCGGGGG651 CTCTGGCGGG GTTGGTGGGG GTGGGCGTTC TCGTTGTTTC AGCGGCGCTG701 CCCCAGGCCC TGCGGGAGGG ACCGTGGGAC CCGAGACATC CCCGCCTGGC751 CTCCGCTCCC CACCCGGGAG TGGGGCTCGC ACCCCCCCAA CCTCGGGTAA801 AGACGCTTCT GGAAGGAAGG GCGCCCCGCG GACCCCGCCC AACCCTGCCC851 AGCCCAGCCC AGCCCAGCCC AGCCCTTCCC GGGGCGGCGG CGCGGGAAGC901 AGGCGGCGGC GCACGGGCGT CGTCATGGCA ACCCCACCGG CTCCGGGGGC951 CGGGACCGCT GCCCCCTCCG CCCCTCGACC CCGCCCCCCG CCCTTCCTGG1001 CTGCGGCTGG ACCCGGCTGC GCGGGGCGCG AGGCTGCCTT TCCCGGGATC1051 ACCAGGGACC ACCCGGCGCG CTCCCCGGGA ATCCGCACCC CTGGCCCCAG1101 CGCTCCGGAG CGACCCGGGT CAGCCCCTGG CTGCCTGCAA TGGGCCCCCG1151 GGCGAACCCC GGGCGGACCC AGGAGTGAGC ACCCGGTGCG CGGCAACGAT1201 GATCCCGCAA GGGAAGCTCA CGGGAGGCAG GAGCTGTGGC AGCCGCCCCA1251 GGATGGGGCG CGGGGAGCGC GCTGAGCTGT CCTTTCCCGC AGCGGCCCCG1301 CGGTTGAAGC GTGGGCTTGG GTTTTGGTTT TTCTTCTGTG GCAACAGTTC1351 TGTTGAGATA TTACTCGCCT GCCATACAAC TCACCCATTT TAAAAGTACA1401 CCTCAGGGGT CCTGCGTGTA TTGACAAACC CGCCGCCGTC ACCACAGCCA1451 ATTTCAGAAC ATTTTCATCT CTTCAAAAGA AACCCTGTAC CCTTCAGCTG1501 TCACCCTCCT GGTCCCCATC CGGTCCTCGT CCCGCCCTCA GCAGCCACGC1551 ACTGCCTGTA AAGTCCCCTG TCCTGCCCTG TAGGTGGAAT CTATACCTTG1601 GGGTCTGTTC TGACGTTCAC CTAACAGCCT TTCCAGGCTC AGCTGTGCTA1651 TTGTATGGAC CAGGGGGTTG TTTTGTTTTT GTTGTTTGTT GATTGTGTGT1701 GTGTGTGTGT GTGTGTGTGT GAGCCTGGCG TGGTTGCGGG CGCCTATAAT1751 CCCAGCTGCT CAGGAGGCTG AGGCAGGAGG ATCAB氨基酸序列(SEQ ID NO:5)長(zhǎng)度116個(gè)氨基酸1 MATPPAPGAG TAAPSAPRPR PPPFLAAAGP GCAGREAAFP GITRDHPARS PGIRTPGPSA61 PERPGSAPGC LQWAPGRTPG GPRSEHPVRG NDDPAREAHG RQELWQPPQD GARGARC.核苷酸及氨基酸組合序列(SEQ ID NO:6)克 隆 號(hào)PP13起始編碼子925 ATG終止編碼子1273 TGA蛋白質(zhì)分子量117771 TGG TGG CGC ATG TCT GTA ATC CCA GCT ACT CGG GAA GCT GAG GCA GGA 4849 GAA TCG CTT GAA CCC AGG AAG CGG AGG TTG CAG TGA GCC GAG ATC GCG 9697 CCA CTG CAC TCC AAC CTG GGC AAC AAT ACA AGA CTC CAT CTG AAA AAA144145 AAA AGA TCA CAC AGG AAA ACA GAA GTT CGA TTT TAC GTC GTA CAC TGC192193 TGT AAT TTC AGC ACA TGT GGA CTC GTG TAA CCA ACA CCA TAA CCT TCC240241 ATC ACC CCT GAA ACT CCC TCC CGC CAG CCC TTT AGG GTT GCC CCT CCC288289 CCC GAA CCC CAC CAG CCC CTG GTG ACC ACT GAT CTG TCC TCC AAC CCA336337 TAG TGT TTT TCC GGG AAT GTC ACA AAA ACA GAA GCC GAC CAT GGG TCA384385 CCT TTC TGG CGC CTT TCT CCC CGC ACA AAG TCT TTG TCC TTG TGA AGT432433 TGT RAC GTG CCA AAC GCT TGT CCC TTT TTC CTG CTG GGT AAT ACT CCC480481 GGT GCC GCC CTT GCT GTT CGT CGA TGC ACA TCT GGC TGC TTT TCG CTG528529 GCT GCG AGC GGA GCT GCT AGG GAC ATG GCC ACG GGG CTG TGA GAG CGG576577 AGT TTC CTC TCT CCG GTG ACC CTG AGC TGC GCC TTT CTC AGC CGC CTC624625 CCG AGG CCC CAG GCG CTC TGC GGG GGC TCT GGC GGG GTT GGT GGG GGT672673 GGG CGT TCT CGT TGT TTC AGC GGC GCT GCC CCA GGC CCT GCG GGA GGG720721 ACC GTG GGA CCC GAG ACA TCC CCG CCT GGC CTC CGC TCC CCA CCC GGG768769 AGT GGG GCT CGC ACC CCC CCA ACC TCG GGT AAA GAC GCT TCT GGA AGG816817 AAG GGC GCC CCG CGG ACC CCG CCC AAC CCT GCC CAG CCC AGC CCA GCC864865 CAG CCC AGC CCT TCC CGG GGC GGC GGC GCG GGA AGC AGG CGG CGG CGC912913 ACG GGC GTC GTC ATG GCA ACC CCA CCG GCT CCG GGG GCC GGG ACC GCT9601 Met Ala Thr Pro Pro Ala Pro Gly Ala Gly Thr Ala 12961 GCC CCC TCC GCC CCT CGA CCC CGC CCC CCG CCC TTC CTG GCT GCG GCT 100813 Ala Pro Ser Ala Pro Arg Pro Arg Pro Pro Pro Phe Leu Ala Ala Ala 281009 GGA CCC GGC TGC GCG GGG CGC GAG GCT GCC TTT CCC GGG ATC ACC AGG 105629 Gly Pro Gly Cys Ala Gly Arg Glu Ala Ala Phe Pro Gly Ile Thr Arg 441057 GAC CAC CCG GCG CGC TCC CCG GGA ATC CGC ACC CCT GGC CCC AGC GCT110445 Asp His Pro Ala Arg Ser Pro Gly Ile Arg Thr Pro Gly Pro Ser Ala 601105 CCG GAG CGA CCC GGG TCA GCC CCT GGC TGC CTG CAA TGG GCC CCC GGG115261 Pro Glu Arg Pro Gly Ser Ala Pro Gly Cys Leu Gln Trp Ala Pro Gly 761153 CGA ACC CCG GGC GGA CCC AGG AGT GAG CAC CCG GTG CGC GGC AAC GAT120077 Arg Thr Pro Gly Gly Pro Arg Ser Glu His Pro Val Arg Gly Asn Asp 921201 GAT CCC GCA AGG GAA GCT CAC GGG AGG CAG GAG CTG TGG CAG CCG CCC124893 Asp Pro Ala Arg Glu Ala His Gly Arg Gln Glu Leu Trp Gln Pro Pro 1081249 CAG GAT GGG GCG CGG GGA GCG CGC TGA GCT GTC CTT TCC CGC AGC GGC1296109 Gln Asp Gly Ala Arg Gly Ala Arg ***1171297 CCC GCG GTT GAA GCG TGG GCT TGG GTT TTG GTT TTT CTT CTG TGG CAA13441345 CAG TTC TGT TGA GAT ATT ACT CGC CTG CCA TAC AAC TCA CCC ATT TTA13921393 AAA GTA CAC CTC AGG GGT CCT GCG TGT ATT GAC AAA CCC GCC GCC GTC14401441 ACC ACA GCC AAT TTC AGA ACA TTT TCA TCT CTT CAA AAG AAA CCC TGT14881489 ACC CTT CAG CTG TCA CCC TCC TGG TCC CCA TCC GGT CCT CGT CCC GCC15361537 CTC AGC AGC CAC GCA CTG CCT GTA AAG TCC CCT GTC CTG CCC TGT AGG15841585 TGG AAT CTA TAC CTT GGG GTC TGT TCT GAC GTT CAC CTA ACA GCC TTT16321633 CCA GGC TCA GCT GTG CTA TTG TAT GGA CCA GGG GGT TGT TTT GTT TTT16801681 GTT GTT TGT TGA TTG TGT GTG TGT GTG TGT GTG TGT GTG TGA GCC TGG17281729 CGT GGT TGC GGG CGC CTA TAA TCC CAG CTG CTC AGG AGG CTG AGG CAG17761777 GAG GAT CA 1784D.Blastp結(jié)果Query=PP13(116個(gè)氨基酸)>SP_IN:Q19218 Q19218 caenorhabditis elegans.f08g5.4 protein.11/1999長(zhǎng)度=299個(gè)氨基酸分值=36.7bits(83),預(yù)計(jì)值=0.054相同性=33/74(44%),相似性=36/74(48%),缺口=7/74(9%)Query:44 RDHPARSPGIRTPGPSAPERPGSAPGCLQWAPGRTPGGPRSEHPVRGNDDP-AREAHGRQ 102+D PA PG+ PGP+ PEAPGAPG PG P + RG P A A G QSbjct:164 QDGPAGQPG-APGPAGPEGDAGAPGD-AGAPG-APGAP-GQDGQRGTGLPGAPGAPGPQ 218Query:103-ELWQPPQDGARGA 115P QDGA GASbjct:219 GPSGNPGQDGAAGA 232>SP_IN:Q20087 Q20087 caenorhabditis elegans.similar to cuticular collagen.5/1999長(zhǎng)度=299個(gè)氨基酸分值=36.7bits(83),預(yù)計(jì)值=0.054相同性=30/84(35%),相似性=36/84(42%),缺口=13/84(15%)Query:36 EAAFPGITRDHPARSPGIRTPGPSAPERPGSAPGCLQWAPGRTPGGP----RSEHPVRGN 91E PG+P + PGP P P APGAPG TPG P+SE + GSbjct:167 EPGSPGL----PGQDAAPGEPGPKGPPGPPGAPG----APG-TPGEPGVPAQSEPLIPGE 217Query:92 DDPAREAHGRQELWQPPQDGARGA 115P EA + P Q GA G+Sbjct:218 PGPPGEAGPQGPPGSPGQPGADGS 2413.PP578蛋白A核苷酸序列(SEQ ID NO:7)長(zhǎng)度1458bp1 CGCGGAGGGC TGGTGCCCCG CAGCAGGTGG GCGGGGTGCG GTTGGCGGCG51 GCGGCTGGGC CGGGGGCTGC CGGCTGCGCT CGGGCCGTGC GCGGCGGCCG101 TGCGGGCACG CCATGGACTT CAACATGAAG AAGCTGGCGT CGGACGCGGG151 CATCTTCTTC ACCCGGGCGG TGCAGTTCAC GGAGGAGAAA TTTGGCCAGG201 CTGAGAAGAC TGAGCTTGAT GCCCACTTTG AAAACCTTCT GGCCCGGGCA251 GACAGCACCA AGAACTGGAC AGAGAAGATC TTGAGGCAGA CAGAGGTGCT301 GCTGCAGCCC AACCCCAGTG CCCGAGTGGA GGAGTTCCTG TATGAGAAGC351 TGGACAGGAA GGTCCCCTCA AGGGTCACCA ACGGGGAGCT GCTGGCTCAG401 TACATGGCAG ACGCGGCCAG TGAGCTGGGG CCGACCACCC CCTATGGGAA451 GACACTGATC AAGGTGGCAG AAGCTTGAAA AGCAACTGGG AGCCCGCGGA501 GAGGGATTTT ATCCACACGG CCTCCATCAG CTTCCTCACA CCCTTGCGCA551 ACTTCCTGGA GGGGGACTGG AAGACCATCT CGAAGGAGAG GCGGCTCCTC601 CAAAACCGGC GTCTGGACTT GGATGCCTGC AAAGCGAGGC TGAAGAAGGC651 CAAGGCTGCA GAAGCCAAAG CCACGACGGT GCCTGACTTT CAGGAGACTA701 GACCTCGTAA TTACATTCTC TCGGCCAGCG CCTCCGCGCT CTGGAATGAT751 GAAGTGGACA AGGCCGAGCA GGAGCTCCGC GTGGCCCAGA CAGAGTTTGA801 CCGGCAAGCA GAAGTGACCC GTCTCTTGCT GGAGGGAATC AGTAGCACTC851 ACGTGAACCA CCTGCGCTGC CTCCACGAGT TCGTCAAGTC TCAGACAACC901 TACTACGCAC ATGCTACCGC CACATGCTGG ACTTGCAGAA GCAGCTGGGC951 AGATTTCCCG GCACCTTCGT GGGCACCACA GAGCCCGCCT CCCCACCCCT1001 GAGCAGCACC TCACCCACCA CTGCTGCGGC CACTATGCCT GTGGTGCCCT1051 CTGTGGCCAG CCTGGCCCCT CCGGGGGAGG CCTCGCTCTG CCTGGAAGAG1101 GTGGCCCCCC CTGCCAGTGG GACCCGCAAA GCTCGGGTGC TCTATGACTA1151 CGAGGCAGCC GACAGCAGTG AGCTGGCCCT GCTGGCTGAT GAGCTCATCA1201 CTGTTTACAG CCTGCCTGGC ATGGACCCTG ACTGGCTCAT TGGCGAGAGA1251 GGCAACAAGA AGGGCAAGGT CCCTGTCACC TACTTGGAAC TGCTCAGCTA1301 GCTCAAGCCA AGTCCAGCGG CCGCAGTTTT CACCTCTCCA CACTCACTTT1351 TTATCTGGTG TTTTTACTTC TGCCTGCGTT TGCTCTCTAG CCAATAAACC1401 GTCCTTGTGT GCGAGTCCAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1451 AAAAAAAAB氨基酸序列(SEQ ID NO:8)長(zhǎng)度125個(gè)氨基酸1 MLDLQKQLGR FPGTFVGTTE PASPPLSSTS PTTAAATMPV VPSVASLAPP GEASLCLEEV61 APPASGTRKA RVLYDYEAAD SSELALLADE LITVYSLPGM DPDWLIGERG NKKGKVPVTY121 LELLSC.核苷酸及氨基酸組合序列(SEQ ID NO:9)克 隆 號(hào)PP578起始編碼子924 ATG終止編碼子1301 TAG蛋白質(zhì)分子量131021 CG CGG AGG GCT GGT GCC CCG CAG CAG GTG GGC GGG GTG CGG TTG GCG 4748 GCG GCG GCT GGG CCG GGG GCT GCC GGC TGC GCT CGG GCC GTG CGC GGC 9596 GGC CGT GCG GGC ACG CCA TGG ACT TCA ACA TGA AGA AGC TGG CGT CGG 143144 ACG CGG GCA TCT TCT TCA CCC GGG CGG TGC AGT TCA CGG AGG AGA AAT 191192 TTG GCC AGG CTG AGA AGA CTG AGC TTG ATG CCC ACT TTG AAA ACC TTC 239240 TGG CCC GGG CAG ACA GCA CCA AGA ACT GGA CAG AGA AGA TCT TGA GGC 287288 AGA CAG AGG TGC TGC TGC AGC CCA ACC CCA GTG CCC GAG TGG AGG AGT 335336 TCC TGT ATG AGA AGC TGG ACA GGA AGG TCC CCT CAA GGG TCA CCA ACG 383384 GGG AGC TGC TGG CTC AGT ACA TGG CAG ACG CGG CCA GTG AGC TGG GGC 431432 CGA CCA CCC CCT ATG GGA AGA CAC TGA TCA AGG TGG CAG AAG CTT GAA 479480 AAG CAA CTG GGA GCC CGC GGA GAG GGA TTT TAT CCA CAC GGC CTC CAT 527528 CAG CTT CCT CAC ACC CTT GCG CAA CTT CCT GGA GGG GGA CTG GAA GAC 575576 CAT CTC GAA GGA GAG GCG GCT CCT CCA AAA CCG GCG TCT GGA CTT GGA 623624 TGC CTG CAA AGC GAG GCT GAA GAA GGC CAA GGC TGC AGA AGC CAA AGC 671672 CAC GAC GGT GCC TGA CTT TCA GGA GAC TAG ACC TCG TAA TTA CAT TCT 719720 CTC GGC CAG CGC CTC CGC GCT CTG GAA TGA TGA AGT GGA CAA GGC CGA 767768 GCA GGA GCT CCG CGT GGC CCA GAC AGA GTT TGA CCG GCA AGC AGA AGT 815815 GAC CCG TCT CTT GCT GGA GGG AAT CAG TAG CAC TCA CGT GAA CCA CCT 853864 GCG CTG CCT CCA CGA GTT CGT CAA GTC TCA GAC AAC CTA CTA CGC ACA 911912 TGC TAC CGC CAC ATG CTG GAC TTG CAG AAG CAG CTG GGC AGA TTT CCC 9591 Met Leu Asp Leu Gln Lys Gln Leu Gly Arg Phe Pro 12960 GGC ACC TTC GTG GGC ACC ACA GAG CCC GCC TCC CCA CCC CTG AGC AGC100713 Gly Thr Phe Val Gly Thr Thr Glu Pro Ala Ser Pro Pro Leu Ser Ser 281008 ACC TCA CCC ACC ACT GCT GCG GCC ACT ATG CCT GTG GTG CCC TCT GTG105529 Thr Ser Pro Thr Thr Ala Ala Ala Thr Met Pro Val Val Pro Ser Val 441056 GCC AGC CTG GCC CCT CCG GGG GAG GCC TCG CTC TGC CTG GAA GAG GTG110345 Ala Ser Leu Ala Pro Pro Gly Glu Ala Ser Leu Cys Leu Glu Glu Val 601104 GCC CCC CCT GCC AGT GGG ACC CGC AAA GCT CGG GTG CTC TAT GAC TAC115161 Ala Pro Pro Ala Ser Gly Thr Arg Lys Ala Arg Val Leu Tyr Asp Tyr 761152 GAG GCA GCC GAC AGC AGT GAG CTG GCC CTG CTG GCT GAT GAG CTC ATC119977 Glu Ala Ala Asp Ser Ser Glu Leu Ala Leu Leu Ala Asp Glu Leu Ile 921200 ACT GTT TAC AGC CTG CCT GGC ATG GAC CCT GAC TGG CTC ATT GGC GAG124793 Thr Val Tyr Ser Leu Pro Gly Met Asp Pro Asp Trp Leu Ile Gly Glu 1081248 AGA GGC AAC AAG AAG GGC AAG GTC CCT GTC ACC TAC TTG GAA CTG CTC1295109 Arg Gly Asn Lys Lys Gly Lys Val Pro Val Thr Tyr Leu Glu Leu Leu 1241296 AGC TAG CTC AAG CCA AGT CCA GCG GCC GCA GTT TTC ACC TCT CCA CAC1343125 Ser *** 1261344 TCA CTT TTT ATC TGG TGT TTT TAC TTC TGC CTG CGT TTG CTC TCT AGC13911392 CAA TAA ACC GTC CTT GTG TGC GAG TCC AAA AAA AAA AAA AAA AAA AAA14391440 AAA AAA AAA AAA AAA AAA A 14584.PP905蛋白A核苷酸序列(SEQ ID NO:10)長(zhǎng)度2356bp1 GCACTGCTTA GTGGACCTCA TTTAATCTTC CCAATAATCC AGTGAAGTGG51 GTGTTACTAT CCCATTGACA GGAAAGAAAT CTGAGCTGCA GAGATAAGGC101 AGAACTCCCA AGGTGCCACC AAGGCTCAGA CACACAGATT CTCAGAGGAA151 GTGTGGACTC ACAGGTGGGC AATGCCTAGC AGAGGCAAAG ATATAGAGGT201 AAGGGAGTTC CTTACTTACT ATATCTTACA AAGATATAGA GGTAAGGGAG251 TTCCTTACTT ACTATATCTT ACAAAGATAT AGAGGTAAGG GAGTTCCTCT301 GAATCTGGGT GGCCAGATTC AGCTTCCCAC CCAACCCTGG GTCCCCAGGA351 GGTGGTGTCA AGAGAGGCCA TGGCCTGGGA TGCGGGCCCT TCTTCCTCCC401 AGAACACTGG CCTGAATCAG CCAGCTCTTG GCACACACAG CCAGGTCCAC451 AGGCACAACT GTTCCTTGGG GCCCCTGAGG GCAGGGGGTG TGCTGGGGCT501 GTGGCTTGTA ATGTCTGGAG TGAGTGCAGG CTCAGATCAG GGCGAGGCTG551 CTTGTCCAGA GAGGCAGAAA ATTCTCCAAC AGAAGACCCC CAAGGCGGAG601 GGCCCTGGGG CTGGACTCCT GGAGGTTGTT CTGAGCTTAC CCTGTGGACG651 GATTGGAGGG TGGCCCTCCT TCCCCACAAG GATCAAGAGG GGGTGGGGGA701 TGGTGGGAGG GCAATCTGGC CAGGCGAACC TGCGGGGGAG GCTCCCGCCC751 TCCCCAGTCC CACCATCTCA GCCCCGCAGC CTCTTTCTCC CTGGAGACAG801 CCAGGTGCGG CCCAGGATCC CGGGAAAGGC AGGGGAGGGG GTGGCGTCTT851 CGCTCCTCAG GCGCTGGCCC GGCCCAGAGG GGACAGGAAG CCAGGACACC901 GGGGATTGTC TCTCGCAACC GCAGCCCAGC CCCAGTCCGG GAGGAAGTTC951 TGCCCGGCGC TCTCCGCCGG TGCCTCCCTG GTTATATTGT TGAACAGGAA1001 ACCCGGCAGC GCGGGAGCCG CACAGTCGAG GAGGGAGCGC GGGACGCCGA1051 GCCCACGCGC GCCTGCCGGG GCAAGTGGAG GCGAAGCCGG CGAGCGGACG1101 CCCCGAGGGT CGGGGAAGGA ACCGAGGTCC GGTCCCCTTC TTATCCAGCC1151 CGAGACATCG AGCTCCGGTG GGCGTCCCTG CGCTGGGAAT CCCGCTCGGA1201 GTTTTTCCAG GCCCGGCCGG GCTGCTCCGG GAAAGGCCCT GCTCCTGTTC1251 CGCGCAGCCT CTCCGGCCTC GCCCCTGGAA ACCCCGCCCA GGGCGATGGT1301 AGGGGCCTAA CCTGCAGCCA CCGCCGGCTC CGCCCACCCA GCCCATGGGC1351 TCCCTGAGGC CCGCCCAGCC GACGAAAACG CCGCGGCTGC GATGGCGGCG1401 GACGTGGTGG GGGACGTGTA CGTGCTGGTG GAGCACCCCT TCGAGTACAC1451 CGGCAAGGAC GGGCGCCGCG TGGCCATCCG GCCGAATGAG CGCTACCGGC1501 TGCTGCGGCG CAACACCGAG CACTGGTGGC ACGTGCGGCG TGAGCCCGGC1551 GGCCGCCCCT TCTACCTGCC TGCGCAGTAC GTGCGCGAGC TGCCCGCGCT1601 GGGCAACCCT GCCGCCGCCG CGCCGCCAGG TCCCCACCCG AGCCCCGCGG1651 CCCCTGAGCC GCTCGCCTAC GACTACCGGT TTGTGAGCGC GGCGGCGACC1701 GCGGGCCCCG ACGGCGCCCC CGAGGAGTCC GGAGGCCGAG CCAGCTCCCT1751 GTGCGGCCCT GCGCAACGCG GCGCCGCGAC CCAGCGCAGC AGCCTGGCGC1801 CCGGCCTGCC AGCCTGCCTG TACCTGCGGC CCGCGGCGCC CGTGCGGCCC1851 GCGCAGTCCC TGAACGACCT GGCCTGCGCC GCCGTCTCGC CTCCCGCCGG1901 CCTCCTAGGA AGCAGCGGCA GCTTCAAGGC CTGCAGCGTG GCGGGCTCCT1951 GGGTGTGCCC GCGGCCTCTG GCGCGCAGCG ACTCAGAGAA CGTCTACGAG2001 GTCATCCAGG ACTTGCACGT CCCGCCGCCG GAGGAGAGCG CAGAGCAGGT2051 ACCTCCCCGG GCGCTGGGGC GCGGAGGCGG GTGGCGCGCT AGGGACCGCG2101 CCCGCACGGA GCCGGGGCGC AAGGAGACCC GCTCCGCTCA GCGTCGGGCA2151 CGACGCCCAC CTCTGTCCGA AGACTTCGGA TGAGCTCCCT CTCCCCAACC2201 GCGAAACGTG AGGGGTGCAC GCCCGCAGTC CCTCATCAGC AATTCCCAAG2251 CTCCAAAGCT CCCTGGAAGC CCAGAGGCTT TTCGTAATCC AATTGGTGGC2301 AAAATTGCGC TTGAACTGAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2351 AAAAAAB氨基酸序列(SEQ ID NO:11)長(zhǎng)度263個(gè)氨基酸1 MAADVVGDVY VLVEHPFEYT GKDGRRVAIR PNERYRLLRR NTEHWWHVRR EPGGRPFYLP61 AQYVRELPAL GNPAAAAPPG PHPSPAAPEP LAYDYRFVSA AATAGPDGAP EESGGRASSL121 CGPAQRGAAT QRSSLAPGLP ACLYLRPAAP VRPAQSLNDL ACAAVSPPAG LLGSSGSFKA181 CSVAGSWVCP RPLARSDSEN VYEVIQDLHV PPPEESAEQV PPRALGRGGG WRARDRARTE241 PGRKETRSAQ RRARRPPLSE DFGC.核昔酸及氨基酸組合序列(SEQ ID NO:12)克隆號(hào)PP905起始編碼子1392 ATG終止編碼子2183 TGA蛋白質(zhì)分子量282171 GC ACT GCT TAG TGG ACC TCA TTT AAT CTT CCC AAT AAT CCA GTG AAG 4748 TGG GTG TTA CTA TCC CAT TGA CAG GAA AGA AAT CTG AGC TGC AGA GAT 9596 AAG GCA GAA CTC CCA AGG TGC CAC CAA GGC TCA GAC ACA CAG ATT CTC 143144 AGA GGA AGT GTG GAC TCA CAG GTG GGC AAT GCC TAG CAG AGG CAA AGA 191192 TAT AGA GGT AAG GGA GTT CCT TAC TTA CTA TAT CTT ACA AAG ATA TAG 239240 AGG TAA GGG AGT TCC TTA CTT ACT ATA TCT TAC AAA GAT ATA GAG GTA 287288 AGG GAG TTC CTC TGA ATC TGG GTG GCC AGA TTC AGC TTC CCA CCC AAC 335336 CCT GGG TCC CCA GGA GGT GGT GTC AAG AGA GGC CAT GGC CTG GGA TGC 383384 GGG CCC TTC TTC CTC CCA GAA CAC TGG CCT GAA TCA GCC AGC TCT TGG 431432 CAC ACA CAG CCA GGT CCA CAG GCA CAA CTG TTC CTT GGG GCC CCT GAG 479480 GGC AGG GGG TGT GCT GGG GCT GTG GCT TGT AAT GTC TGG AGT GAG TGC 527528 AGG CTC AGA TCA GGG CGA GGC TGC TTG TCC AGA GAG GCA GAA AAT TCT 575576 CCA ACA GAA GAC CCC CAA GGC GGA GGG CCC TGG GGC TGG ACT CCT GGA 623624 GGT TGT TCT GAG CTT ACC CTG TGG ACG GAT TGG AGG GTG GCC CTC CTT 671672 CCC CAC AAG GAT CAA GAG GGG GTG GGG GAT GGT GGG AGG GCA ATC TGG 719720 CCA GGC GAA CCT GCG GGG GAG GCT CCC GCC CTC CCC AGT CCC ACC ATC 767768 TCA GCC CCG CAG CCT CTT TCT CCC TGG AGA CAG CCA GGT GCG GCC CAG 815816 GAT CCC GGG AAA GGC AGG GGA GGG GGT GGC GTC TTC GCT CCT CAG GCG 863864 CTG GCC CGG CCC AGA GGG GAC AGG AAG CCA GGA CAC CGG GGA TTG TCT 911912 CTC GCA ACC GCA GCC CAG CCC CAG TCC GGG AGG AAG TTC TGC CCG GCG 959960 CTC TCC GCC GGT GCC TCC CTG GTT ATA TTG TTG AAC AGG AAA CCC GGC10071008 AGC GCG GGA GCC GCA CAG TCG AGG AGG GAG CGC GGG ACG CCG AGC CCA10551056 CGC GCG CCT GCC GGG GCA AGT GGA GGC GAA GCC GGC GAG CGG ACG CCC11031104 CGA GGG TCG GGG AAG GAA CCG AGG TCC GGT CCC CTT CTT ATC CAG CCC11511152 GAG ACA TCG AGC TCC GGT GGG CGT CCC TGC GCT GGG AAT CCC GCT CGG11991200 AGT TTT TCC AGG CCC GGC CGG GCT GCT CCG GGA AAG GCC CTG CTC CTG12471248 TTC CGC GCA GCC TCT CCG GCC TCG CCC CTG GAA ACC CCG CCC AGG GCG12951296 ATG GTA GGG GCC TAA CCT GCA GCC ACC GCC GGC TCC GCC CAC CCA GCC13431344 CAT GGG CTC CCT GAG GCC CGC CCA GCC GAC GAA AAC GCC GCG GCT GCG13911392 ATG GCG GCG GAC GTG GTG GGG GAC GTG TAC GTG CTG GTG GAG CAC CCC14391 Met Ala Ala Asp Val Val Gly Asp Val Tyr Val Leu Val Glu His Pro 161440 TTC GAG TAC ACC GGC AAG GAC GGG CGC CGC GTG GCC ATC CGG CCG AAT148717 Phe Glu Tyr Thr Gly Lys Asp Gly Arg Arg Val Ala Ile Arg Pro Asn 321488 GAG CGC TAC CGG CTG CTG CGG CGC AAC ACC GAG CAC TGG TGG CAC GTG153533 Glu Arg Tyr Arg Leu Leu Arg Arg Asn Thr Glu His Trp Trp His Val 481536 CGG CGT GAG CCC GGC GGC CGC CCC TTC TAC CTG CCT GCG CAG TAC GTG158349 Arg Arg Glu Pro Gly Gly Arg Pro Phe Tyr Leu Pro Ala Gln Tyr Val 641584 CGC GAG CTG CCC GCG CTG GGC AAC CCT GCC GCC GCC GCG CCG CCA GGT163165 Arg Glu Leu Pro Ala Leu Gly Asn Pro Ala Ala Ala Ala Pro Pro Gly 801632 CCC CAC CCG AGC CCC GCG GCC CCT GAG CCG CTC GCC TAC GAC TAC CGG167981 Pro His Pro Ser Pro Ala Ala Pro Glu Pro Leu Ala Tyr Asp Tyr Arg 961680 TTT GTG AGC GCG GCG GCG ACC GCG GGC CCC GAC GGC GCC CCC GAG GAG172797 Phe Val Ser Ala Ala Ala Thr Ala Gly Pro Asp Gly Ala Pro Glu Glu 1121728 TCC GGA GGC CGA GCC AGC TCC CTG TGC GGC CCT GCG CAA CGC GGC GCC1775113 Ser Gly Gly Arg Ala Ser Ser Leu Cys Gly Pro Ala Gln Arg Gly Ala 1281776 GCG ACC CAG CGC AGC AGC CTG GCG CCC GGC CTG CCA GCC TGC CTG TAC1823129 Ala Thr Gln Arg Ser Ser Leu Ala Pro Gly Leu Pro Ala Cys Leu Tyr 1441824 CTG CGG CCC GCG GCG CCC GTG CGG CCC GCG CAG TCC CTG AAC GAC CTG1871145 Leu Arg Pro Ala Ala Pro Val Arg Pro Ala Gln Ser Leu Asn Asp Leu 1601872 GCC TGC GCC GCC GTC TCG CCT CCC GCC GGC CTC CTA GGA AGC AGC GGC1919161 Ala Cys Ala Ala Val Ser Pro Pro Ala Gly Leu Leu Gly Ser Ser Gly 1761920 AGC TTC AAG GCC TGC AGC GTG GCG GGC TCC TGG GTG TGC CCG CGG CCT1967177 Ser Phe Lys Ala Cys Ser Val Ala Gly Ser Trp Val Cys Pro Arg Pro 1921968 CTG GCG CGC AGC GAC TCA GAG AAC GTC TAC GAG GTC ATC CAG GAC TTG2015193 Leu Ala Arg Ser Asp Ser Glu Asn Val Tyr Glu Val Ile Gln Asp Leu 2082016 CAC GTC CCG CCG CCG GAG GAG AGC GCA GAG CAG GTA CCT CCC CGG GCG2053209 His Val Pro Pro Pro Glu Glu Ser Ala Glu Gln Val Pro Pro Arg Ala 2242064 CTG GGG CGC GGA GGC GGG TGG CGC GCT AGG GAC CGC GCC CGC ACG GAG2111225 Leu Gly Arg Gly Gly Gly Trp Arg Ala Arg Asp Arg Ala Arg Thr Glu 2402112 CCG GGG CGC AAG GAG ACC CGC TCC GCT CAG CGT CGG GCA CGA CGC CCA2159241 Pro Gly Arg Lys Glu Thr Arg Ser Ala Gln Arg Arg Ala Arg Arg Pro 2562160 CCT CTG TCC GAA GAC TTC GGA TGA GCT CCC TCT CCC CAA CCG CGA AAC2207257 Pro Leu Ser Glu Asp Phe Gly *** 2642208 GTG AGG GGT GCA CGC CCG CAG TCC CTC ATC AGC AAT TCC CAA GCT CCA22552256 AAG CTC CCT GGA AGC CCA GAG GCT TTT CGT AAT CCA ATT GGT GGC AAA23032304 ATT GCG CTT GAA CTG AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA23512352 AAA AA 23565.PP1579蛋白A核苷酸序列(SEQ ID NO:13)長(zhǎng)度1784bp1 AAAAAAAAAA AAAAAAAGTT TCTATACATT CATAAAGTTT CAAGATTTGG51 GGGTGTGTTT TCACTTCTCC ATCGTCATGG ACTCCAATCT GCCATCTATT101 TCCAAGGCCC TTCCAGGTCC TGTGTCCCTC AGCTAGTGGT ATGCTTCACT151 TGGGACCCAG AGATACATGG GCATTATAGT TCAAATTATA ATTAAGTTTA201 GAACTCTATT GAGACAGAAG AAAGAAAACA GAGCTAAGGT GAAATATCTC251 TGATAATCTG TGTTGGTTAA TATCTAGGAT CCTAGTACCA GATATGTTGG301 AGTGTGAGCT GGTGTCTTCT GCCTGTAAGA CACTACCTCT CTAGCAACTG351 AATTTAGCAA ATACAATCGT AATCCCAGCA TGTTAGGGAG GCCAGGGTGG401 GCAGATCATC TGAGGTCGGG AGTTCAAGAC CAGCCTGGCC AACATGGGGA451 AACCCTGTCT CTACTAAAAA TACAAAACTT AGCTGGGTGT GGTGGCACGC501 GCATGTGTGT ACACACACAC ACCCCCCTGT AATCCCAGCT ACTCGGAAGG551 CTGGGGCACA AGAATCGCGT GAAACCATGA GGCGGAGGTT GAAGTGAGCC601 ACCGTGCCAG CTGAGAATCC TTTTTACTTC TCCAACTTCT GTTGGCCACC651 TGCATTCCTT GGCTTGTGGC CCTTCCTCCA ACTTCGGCAG AGCATCTTCA701 AACGTTGCCC TGGCTCCCTT ATCACGTCAC CTCCTGCTGG CTTTGACTCT751 CAGCTCCCTC TTATGAGGAT CCCTGTGATT GCTGGACCTA CCCAAATAAA801 CCAGGATATA AACCATCTTA AGATGCTCAG TCACCTCTAC GAGGTCCCTT851 TTGCTCGCAG GTGCCAGGAG TTGGGACTTG GACATCTTTA GGGGAGGCCA901 TTCTTCTGTC CACCACACCA CCCCATGATT CCATTTCCAT GTCACCACTG951 TCTCTAAGTG TGTCTAACCC ACGGCTCAAG AGTCAAAGGT GCATCACAGC1001 AGTGAGAACT CACAGGTTCG GGTTTGCTTT CTTCCTGTGG TTGATTTCTA1051 GGCTTTGGAA CTGCGACATA ACTAGCGATG GCTGCTGCGA TCTCACAAAG1101 CTTCTCCAAG AAAAATCAAG CCTGTTGTGT TTGGATCTGG GGCTGAATCA1151 CATAGGAGTT AAGGGAATGA AGTTCCTGTG TGAGGCTTTG AGGAAACCAC1201 TGTGCAACTT GAGATGTCTG TGGTTGTGGG GATGTTCCAT CCCTCCGTTC1251 AGTTGTGAAG ACCTCTGCTC TGCCCTCAGC TGCAACCAGA GCCTGTCACT1301 CTGGACCTGG GTCAGAATCC CTTGGGGTCT AGTGGAGTGA AGATGCTGTT1351 TGAAACCTTG ACATGTTCCA GTGGCACCCT CCGGACACTC AGGTTGAAAA1401 TAGATGACTT TAATGATGAA CTCAATAAGC TGCTGGAAGA AATAGAAGAA1451 AAAAACCCAC AACTGATTAT TGATACTGAG AAACATCATC CCTGGGCAGA1501 AAGGCCTTCT TCTCATGACT TCATGATCTG AATCCCCCCG AGTCATTCAT1551 TCTCCATGAA GTCATCGATT TTCCAGGTGT TGGTGAACTG CCTGTGACTC1601 CTCTCCTCCC CGGCCCCTAC CCCTCAGGGA TAATGAGTTC ATTGCTGGGC1651 TAGATGTTTT AGCCATGATT CTGCCTCTGT TTTATACCTG CACACATCCT1701 TATCTTTGTT ACATATGAAA TATCTGTATC ACGGGTATAT TGAGAGAAAT1751 AAAGGTGAGA GCATTCAAAA AAAAAAAAAA AAAAB氨基酸序列(SEQ ID NO:14)長(zhǎng)度134個(gè)氨基酸1 MSPLSLSVSN PRLKSQRCIT AVRTHRFGFA FFLWLISRLW NCDITSDGCC DLTKLLQEKS61 SLLCLDLGLN HIGVKGMKFL CEALRKPLCN LRCLWLWGCS IPPFSCEDLC SALSCNQSLS121 LWTWVRIPWG LVEC.核苷酸及氨基酸組合序列(SEQ ID NO:15)克隆號(hào)PP1579起始編碼子 939 ATG終止編碼子1340 TGA蛋白質(zhì)分子量151251 AA AAA AAA AAA AAA AAA GTT TCT ATA CAT TCA TAA AGT TTC AAG ATT 4748 TGG GGG TGT GTT TTC ACT TGT CCA TCG TCA TGG ACT CCA ATC TGC CAT 9596 CTA TTT CCA AGG CCC TTC CAG GTC CTG TGT CCC TCA GCT AGT GGT ATG 143144 CTT CAC TTG GGA CCC AGA GAT ACA TGG GCA TTA TAG TTC AAA TTA TAA 191192 TTA AGT TTA GAA CTC TAT TGA GAC AGA AGA AAG AAA ACA GAG CTA AGG 239240 TGA AAT ATC TCT GAT AAT CTG TGT TGG TTA ATA TCT AGG ATC CTA GTA 287288 CCA GAT ATG TTG GAG TGT GAG CTG GTG TCT TCT GCC TGT AAG ACA CTA 335336 CCT CTC TAG CAA CTG AAT TTA GCA AAT ACA ATC GTA ATC CCA GCA TGT 383384 TAG GGA GGC CAG GGT GGG CAG ATC ATC TGA GGT CGG GAG TTC AAG ACC 431432 AGC CTG GCC AAC ATG GGG AAA CCC TGT CTC TAC TAA AAA TAC AAA ACT 479480 TAG CTG GGT GTG GTG GCA CGC GCA TGT GTG TAC ACA CAC ACA CCC CCC 527528 TGT AAT CCC AGC TAC TCG GAA GGC TGG GGC ACA AGA ATC GCG TGA AAC 575576 CAT GAG GCG GAG GTT GAA GTG AGC CAC CGT GCC AGC TGA GAA TCC TTT 623624 TTA CTT CTC CAA CTT CTG TTG GCC ACC TGC ATT CCT TGG CTT GTG GCC 671672 CTT CCT CCA ACT TCG GCA GAG CAT CTT CAA ACG TTG CCC TGG CTC CCT 719720 TAT CAC GTC ACC TCC TGC TGG CTT TGA CTC TCA GCT CCC TCT TAT GAG 767768 GAT CCC TGT GAT TGC TGG ACC TAC CCA AAT AAA CCA GGA TAT AAA CCA 815816 TCT TAA GAT GCT CAG TCA CCT CTA CGA GGT CCC TTT TGC TCG CAG GTG 863864 CCA GGA GTT GGG ACT TGG ACA TCT TTA GGG GAG GCC ATT CTT CTG TCC 911912 ACC ACA CCA CCC CAT GAT TCC ATT TCC ATG TCA CCA CTG TCT CTA AGT 9591 Met Ser Pro Leu Ser Leu Ser 7960 GTG TCT AAC CCA CGG CTC AAG AGT CAA AGG TGC ATC ACA GCA GTG AGA10078 Val Ser Asn Pro Arg Leu Lys Ser Gln Arg Cys Ile Thr Ala Val Arg 231008 ACT CAC AGG TTC GGG TTT GCT TTC TTC CTG TGG TTG ATT TCT AGG CTT105524 Thr His Arg Phe Gly Phe Ala Phe Phe Leu Trp Leu Ile Ser Arg Leu 391056 TGG AAC TGC GAC ATA ACT AGC GAT GGC TGC TGC GAT CTC ACA AAG CTT110340 Trp Asn Cys Asp Ile Thr Ser Asp Gly Cys Cys Asp Leu Thr Lys Leu 551104 CTC CAA GAA AAA TCA AGC CTG TTG TGT TTG GAT CTG GGG CTG AAT CAC115156 Leu Gln Glu Lys Ser Ser Leu Leu Cys Leu Asp Leu Gly Leu Asn His 711152 ATA GGA GTT AAG GGA ATG AAG TTC CTG TGT GAG GCT TTG AGG AAA CCA119972 Ile Gly Val Lys Gly Met Lys Phe Leu Cys Glu Ala Leu Arg Lys Pro 871200 CTG TGC AAC TTG AGA TGT CTG TGG TTG TGG GGA TGT TCC ATC CCT CCG124788 Leu Cys Asn Leu Arg Cys Leu Trp Leu Trp Gly Cys Ser Ile Pro Pro 1031248 TTC AGT TGT GAA GAC CTC TGC TCT GCC CTC AGC TGC AAC CAG AGC CTG1295104 Phe Ser Cys Glu Asp Leu Cys Ser Ala Leu Ser Cys Asn Gln Ser Leu 1191296 TCA CTC TGG ACC TGG GTC AGA ATC CCT TGG GGT CTA GTG GAG TGA AGA1343120 Ser Leu Trp Thr Trp Val Arg Ile Pro Trp Gly Leu Val Glu *** 1341344 TGC TGT TTG AAA CCT TGA CAT GTT CCA GTG GCA CCC TCC GGA CAC TCA13911392 GGT TGA AAA TAG ATG ACT TTA ATG ATG AAC TCA ATA AGC TGC TGG AAG14391440 AAA TAG AAG AAA AAA ACC CAC AAC TGA TTA TTG ATA CTG AGA AAC ATC14871488 ATC CCT GGG CAG AAA GGC CTT CTT CTC ATG ACT TCA TGA TCT GAA TCC15351536 CCC CGA GTC ATT CAT TCT CCA TGA AGT CAT CGA TTT TCC AGG TGT TGG15831584 TGA ACT GCC TGT GAC TCC TCT CCT CCC CGG CCC CTA CCC CTC AGG GAT16311632 AAT GAG TTC ATT GCT GGG CTA GAT GTT TTA GCC ATG ATT CTG CCT CTG16791680 TTT TAT ACC TGC ACA CAT CCT TAT CTT TGT TAC ATA TGA AAT ATC TGT17271728 ATC ACG GGT ATA TTG AGA GAA ATA AAG GTG AGA GCA TTC AAA AAA AAA17751776 AAA AAA AAA1784D.B1astp結(jié)果Query=PP1579(133個(gè)氨基酸)>SP_FUN:Q06149 Q06149 saccharomyces cerevisiae(baker′s yeast).
putative 81.3 kd transcriptional regulatory protein.11/1999長(zhǎng)度=701個(gè)氨基酸分值=34.8bits(78),預(yù)計(jì)值=0.27相同性=27/91(29%),相似性=41/91(44%),缺口=9/91(9%)Query:31 FFLWLISRLWNCDITSDGCCDLTKLLQEKSSLL--CLDLGLNHIGVKGMKFLCEALRKPL 88F L IS + NC +DG D T+ + + L C+ LGLN I K+ +Sbjct:287 FLLSYISVMINC---TDGVWDATQGVDLINELCQGCISLGLNDID----KWYLNESEETK 339Query:89 CNLRCLWLWGCSIPPFSCEDLCSALSCNQSL 119NLRC+W W + + D+ + S + LSbjct:340 QNLRCIWFWALFLDVSTSYDIGNPPSISDDL 370>SP_IN:Q19857 Q19857 caenorhabditis elegans.f28c1.3 protein(片段).5/1999長(zhǎng)度=631個(gè)氨基酸分值=34.8bits(78),預(yù)計(jì)值=0.27相同性=22/70(31%),相似性=34/70(48%),缺口=4/70(5%)Query:54 KLLQEKSSLLCLDLGLNHIGVKGMKFLCEALRK----PLCNLRCLWLWGCSIPPFSCEDL 109+L+ SSL LDL N IG G++ +C+ LR+L + LW ++ S + LSbjct:276 QLITSNSSLQLLDLRNNSIGDSGVRHICDGLRHREAVEKSSLSAMVLWNNNVTGASMDSL 335Query:110 CSALSCNQSL 119AL N +Sbjct:336 AEALIENTKI 345分值=32.1bits(71),預(yù)計(jì)值=1.8相同性=16/46(34%),相似性=27/46(57%)Query:39 LWNCDITSDGCCDLTKLLQEKSSLLCLDLGLNHIGVKGMKFLCEAL 84LWN ++T L + L E + + L++G N++GV+G+ L ALSbjct:322 LWNNNVTGASMDSLAEALIENTKIETLNIGNNNLGVEGIARLKPAL 367在本發(fā)明提及的所有文獻(xiàn)都在本申請(qǐng)中引用作為參考,就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書所限定的范圍。
權(quán)利要求
1.一種分離的具有抑癌功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權(quán)利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權(quán)利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補(bǔ)的多核苷酸。
4.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14。
5.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15的編碼區(qū)序列或全長(zhǎng)序列。
6.一種載體,其特征在于,它含有權(quán)利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細(xì)胞,其特征在于,它是選自下組的一種宿主細(xì)胞(a)用權(quán)利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞;(b)用權(quán)利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達(dá)具有抑癌功能的人蛋白的條件下,培養(yǎng)權(quán)利要求7所述的宿主細(xì)胞;(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權(quán)利要求1所述的具有抑癌功能的人蛋白特異性結(jié)合的抗體。
10.一種核酸分子,它含有權(quán)利要求3所述的多核苷酸中連續(xù)的10-800個(gè)核苷酸。
11.一種藥物組合物,其特征在于,它含有安全有效量的權(quán)利要求1所述的多肽以及藥學(xué)上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白,編碼此多肽的多核苷酸和經(jīng)重組技術(shù)產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號(hào)A61K38/17GK1323803SQ0011568
公開日2001年11月28日 申請(qǐng)日期2000年5月15日 優(yōu)先權(quán)日2000年5月15日
發(fā)明者顧健人, 楊勝利 申請(qǐng)人:上海市腫瘤研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1