本發(fā)明涉及分子生物學(xué)和醫(yī)學(xué)領(lǐng)域,尤其是涉及一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型及其構(gòu)建方法。
背景技術(shù):
胃癌是我國(guó)乃至全世界范圍內(nèi)最常見的惡性腫瘤之一,我國(guó)每年新發(fā)胃癌患者近40萬(wàn)人,死亡約30萬(wàn)人,約占全部腫瘤死亡病例的1/5。早期診斷和早期治療是提高胃癌療效的重要因素之一,雖然診斷技術(shù)和醫(yī)療技術(shù)在不斷提高,但胃癌的治療效果和臨床預(yù)后仍然不是很理想,臨床診治的胃癌病例大多數(shù)均是進(jìn)展期,伴有淋巴結(jié)轉(zhuǎn)移、腹膜種植或血液轉(zhuǎn)移,致使過(guò)去幾十年來(lái)胃癌患者的五年生存率難以有顯著的提高。眾所周知以?shī)W沙利鉑為主的方案是進(jìn)展期胃癌化療的主流。研究發(fā)現(xiàn):雖然含有奧沙利鉑的mFOLFOX的化療方案在胃癌新輔助化療使多數(shù)患者受益,但是約有38.9%患者對(duì)奧沙利鉑耐藥,也就意味著,對(duì)于耐藥的患者,新輔助化療有可能增加患者的手術(shù)風(fēng)險(xiǎn),甚至延誤了寶貴的手術(shù)時(shí)機(jī)。然而目前尚缺乏有效的預(yù)后判斷及化療療效評(píng)價(jià)指標(biāo)。目前臨床上主要依據(jù)基于臨床病理指標(biāo)(如腫瘤大小、淋巴結(jié)轉(zhuǎn)移數(shù)目、遠(yuǎn)處轉(zhuǎn)移、組織分級(jí)等)的AJCC分期作為疾病預(yù)后的判斷及指導(dǎo)臨床治療,但根據(jù)此分期判斷患者預(yù)后存在較大的異質(zhì)性,亦不能預(yù)測(cè)腫瘤患者對(duì)化療的反應(yīng)。
人類基因組大部分為非編碼RNA(Non-coding RNA,ncRNA),廣泛參與人體生理、病理活動(dòng),與眾多腫瘤密切相關(guān)。大量研究顯示,人類基因組中僅有2%產(chǎn)生的轉(zhuǎn)錄本是可編碼RNA,剩余98%均為非編碼RNA。這類非編碼RNA通常被分為管家ncRNAs和調(diào)節(jié)性ncRNAs兩類。在調(diào)節(jié)性ncRNAs中,至少存在著兩種類型:短鏈非編碼RNA(包括siRNA、miRNA、piRNA)和長(zhǎng)鏈非編碼RNA(Long non-coding RNA,lncRNA)。miRNA已經(jīng)被證明參與了一系列重要的生物過(guò)程并且在人類疾病的發(fā)生發(fā)展中其重要作用。然而,事實(shí)上miRNAs僅僅占了非編碼RNA中的很小一部分,而lncRNA 占了ncRNA 的80%。與具有高度保守性miRNA相比,lncRNA在不同物種間的保守性差,其主要由RNA聚合酶Ⅱ所轉(zhuǎn)錄,起先被認(rèn)為是基因組轉(zhuǎn)錄的“噪音”,其生物學(xué)功能一直未受重視。然而近年來(lái)越來(lái)越多的研究表明lncRNA能夠廣泛地參與基因組調(diào)節(jié),如X染色體失活、基因組印跡、染色質(zhì)修飾、轉(zhuǎn)錄、剪接、翻譯、降解、轉(zhuǎn)運(yùn)等,從而廣泛參與調(diào)控個(gè)體的生長(zhǎng)發(fā)育以及細(xì)胞凋亡、增殖、分化等生命活動(dòng),并與包括腫瘤在內(nèi)的許多疾病有著千絲萬(wàn)縷的聯(lián)系。然而,現(xiàn)有技術(shù)中,還沒(méi)有能夠通過(guò)對(duì)lncRNA進(jìn)行研究來(lái)預(yù)測(cè)患者胃癌復(fù)發(fā)和鉑類藥物反應(yīng)。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型及其構(gòu)建方法,不僅能夠?qū)ξ赴┗颊哳A(yù)后進(jìn)行預(yù)測(cè)并劃分高低危人群,同時(shí)可預(yù)測(cè)患者對(duì)于鉑類化療的敏感性從而減少過(guò)度治療。
為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供的技術(shù)方案如下:
一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型,該模型包括SEQIDNo.1-11中的lncRNA序列。
在上述的本發(fā)明一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型中,所述lncRNA序列的表達(dá)量均與胃癌患者復(fù)發(fā)具有相關(guān)性。
本發(fā)明還提供了一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型的構(gòu)建方法,該方法包括以下步驟:
一、相關(guān)性分析:通過(guò)COX回歸比例風(fēng)險(xiǎn)模型對(duì)多組lncRNA序列進(jìn)行分析,確定SEQ ID No.1-11中的lncRNA序列均與胃癌患者復(fù)發(fā)呈顯著相關(guān)性;
二、重要度確定:利用隨機(jī)森林算法確定該11個(gè)lncRNA序列的重要度均大于0;
三、計(jì)算患者RFS風(fēng)險(xiǎn)指數(shù):計(jì)算上述11個(gè)lncRNA序列的表達(dá)權(quán)重,通過(guò)COX 比例風(fēng)險(xiǎn)回歸模型,依據(jù)風(fēng)險(xiǎn)指數(shù)計(jì)算公式計(jì)算每個(gè)患者RFS(無(wú)復(fù)發(fā)生存率)的風(fēng)險(xiǎn)指數(shù);
四、判斷風(fēng)險(xiǎn):根據(jù)計(jì)算得出的風(fēng)險(xiǎn)指數(shù)值,將患者劃分為高危和低危,判斷患者復(fù)發(fā)風(fēng)險(xiǎn)大小,并依該指標(biāo)預(yù)測(cè)患者對(duì)于鉑類為基礎(chǔ)化療的敏感性;
五、預(yù)測(cè)效能評(píng)價(jià):通過(guò)COX 多因素比例風(fēng)險(xiǎn)回歸模型及ROC 曲線對(duì)所構(gòu)建lncRNA 模型的預(yù)測(cè)效能進(jìn)行評(píng)價(jià);
六、效果驗(yàn)證:獲取獨(dú)立的另組患者的癌組織,經(jīng)過(guò)組織RNA提取并質(zhì)檢后,利用實(shí)時(shí)定量PCR檢測(cè)表達(dá)量,并利用GAPDH作為內(nèi)部參照進(jìn)行校正;依據(jù)表達(dá)水平對(duì)每個(gè)RNA 進(jìn)行賦值后帶入風(fēng)險(xiǎn)指數(shù)計(jì)算公式內(nèi),計(jì)算每位患者的RS 值;判斷每位患者的復(fù)發(fā)風(fēng)險(xiǎn),同時(shí)預(yù)測(cè)其對(duì)鉑類為基礎(chǔ)化療的敏感性。
在上述的本發(fā)明一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型的構(gòu)建方法中,步驟三中所述的風(fēng)險(xiǎn)指數(shù)計(jì)算公式為:
;
其中,為每個(gè)RNA 在兩分類方法中的賦值,為每個(gè)lncRNA序列 的權(quán)重系數(shù)。
在上述的本發(fā)明一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型的構(gòu)建方法中,步驟六中所述采用的實(shí)時(shí)定量PCR檢測(cè)方法中,采用的預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的產(chǎn)品中含有針對(duì)SEQ ID No.1-11中一對(duì)或多對(duì)lncRNA 特異性引物。
進(jìn)一步地,所述特異性引物為特異性探針核苷酸。
進(jìn)一步地,所述預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的產(chǎn)品通過(guò)以下方法預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng):檢測(cè)癌組織樣品中SEQ ID No. 1-11中一個(gè)或多個(gè)lncRNA序列的表達(dá)水平,預(yù)測(cè)胃癌復(fù)發(fā)及對(duì)鉑類化療藥物的敏感性。
基于上述技術(shù)方案,相比于現(xiàn)有技術(shù)本發(fā)明具有以下優(yōu)點(diǎn):
一、在預(yù)測(cè)2年的RFS中,本發(fā)明能夠呈現(xiàn)出較好的預(yù)測(cè)效能,且明顯優(yōu)于常見的臨床病理指標(biāo);
二、本發(fā)明可以預(yù)測(cè)以鉑類為基礎(chǔ)的化療療效;
三、與其他己知與療效相關(guān)的臨床病理因素相比,本發(fā)明為一個(gè)獨(dú)立的預(yù)測(cè)因素。
四、本發(fā)明能夠?yàn)槟[瘤患者治療提供一定的指導(dǎo),為醫(yī)生治療選擇提供參考,進(jìn)而減少過(guò)度或者不必要治療,實(shí)現(xiàn)個(gè)體化治療,提高患者術(shù)后生存率。
五、臨床治療中,在胃癌患者診斷明確后,即可通過(guò)本發(fā)明,快速判斷患者復(fù)發(fā)危險(xiǎn)度及對(duì)于化療的敏感性,并跟據(jù)結(jié)果選擇合適的治療方案,實(shí)現(xiàn)個(gè)體化治療。
附圖說(shuō)明
圖1是本發(fā)明的工作流程示意圖。
圖2是本發(fā)明實(shí)施例中l(wèi)ncRNA 模型以及其他臨床病理信息等因素對(duì)于預(yù)測(cè)胃癌患者RFS的ROC 曲線圖。
圖3是本發(fā)明實(shí)施例中l(wèi)ncRNA預(yù)測(cè)模型及其他臨床病信息等因?qū)ξ赴┗颊哂笊娣治鰣D。
圖4是本發(fā)明實(shí)施例中用實(shí)時(shí)定量PCR方法及其他臨床病信息對(duì)胃癌患者愈后生存分析圖。
圖5是 RS score預(yù)測(cè)胃癌患者鉑類為基礎(chǔ)化療敏感性的ROC曲線圖。
具體實(shí)施方式
下面結(jié)合附圖和具體的實(shí)施例來(lái)對(duì)本發(fā)明一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型及其構(gòu)建方法作進(jìn)一步地詳細(xì)闡述,以求更為清楚明了地理解其結(jié)構(gòu)類型和使用方式,但不能以此來(lái)限定本發(fā)明專利的保護(hù)范圍。
一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型,該模型包括SEQIDNo.1-11中的lncRNA序列,所述lncRNA序列的表達(dá)量均與胃癌患者復(fù)發(fā)具有相關(guān)性。
如圖1所示,本發(fā)明還提供了一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型的構(gòu)建方法,該方法包括以下步驟:
一、相關(guān)性分析:通過(guò)COX回歸比例風(fēng)險(xiǎn)模型對(duì)多組lncRNA序列進(jìn)行分析,確定SEQ ID No.1-11中的lncRNA序列均與胃癌患者復(fù)發(fā)呈顯著相關(guān)性;
二、重要度確定:利用隨機(jī)森林算法確定該11個(gè)lncRNA序列的重要度均大于0;
三、計(jì)算患者RFS風(fēng)險(xiǎn)指數(shù):計(jì)算上述11個(gè)lncRNA序列的表達(dá)權(quán)重,通過(guò)COX 比例風(fēng)險(xiǎn)回歸模型,依據(jù)風(fēng)險(xiǎn)指數(shù)計(jì)算公式計(jì)算每個(gè)患者RFS(無(wú)復(fù)發(fā)生存率)的風(fēng)險(xiǎn)指數(shù),所述風(fēng)險(xiǎn)指數(shù)計(jì)算公式為:
;
其中,為每個(gè)RNA 在兩分類方法中的賦值,為每個(gè)lncRNA序列 的權(quán)重系數(shù)。;
四、判斷風(fēng)險(xiǎn):根據(jù)計(jì)算得出的風(fēng)險(xiǎn)指數(shù)值,將患者劃分為高危和低危,判斷患者復(fù)發(fā)風(fēng)險(xiǎn)大小,并依該指標(biāo)預(yù)測(cè)患者對(duì)于鉑類為基礎(chǔ)化療的敏感性;
五、預(yù)測(cè)效能評(píng)價(jià):通過(guò)COX 多因素比例風(fēng)險(xiǎn)回歸模型及ROC 曲線對(duì)所構(gòu)建lncRNA 模型的預(yù)測(cè)效能進(jìn)行評(píng)價(jià);
六、效果驗(yàn)證:獲取獨(dú)立的另組患者的癌組織,經(jīng)過(guò)組織RNA提取并質(zhì)檢后,利用實(shí)時(shí)定量PCR檢測(cè)表達(dá)量,并利用GAPDH作為內(nèi)部參照進(jìn)行校正;依據(jù)表達(dá)水平對(duì)每個(gè)RNA 進(jìn)行賦值后帶入風(fēng)險(xiǎn)指數(shù)計(jì)算公式內(nèi),計(jì)算每位患者的RS 值;判斷每位患者的復(fù)發(fā)風(fēng)險(xiǎn),同時(shí)預(yù)測(cè)其對(duì)鉑類為基礎(chǔ)化療的敏感性。
在上述的本發(fā)明一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型的構(gòu)建方法中,步驟六中所述采用的實(shí)時(shí)定量PCR檢測(cè)方法中,采用的預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的產(chǎn)品中含有針對(duì)SEQ ID No.1-11中一對(duì)或多對(duì)lncRNA 特異性探針核苷酸。
所述預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的產(chǎn)品通過(guò)以下方法預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng):檢測(cè)癌組織樣品中SEQ ID No.1-11中一個(gè)或多個(gè)lncRNA序列的表達(dá)水平,預(yù)測(cè)胃癌復(fù)發(fā)及對(duì)鉑類化療藥物的敏感性。
實(shí)施例
Ⅰ、建立預(yù)測(cè)模型
一.實(shí)驗(yàn)對(duì)象:
本實(shí)施例的研究對(duì)象選擇2009年1月至2010年12月間組織庫(kù)保存的胃癌組織180例,構(gòu)成訓(xùn)練集。
納入及排除標(biāo)準(zhǔn)為:
(1)新發(fā)胃癌患者,經(jīng)病理確診為胃癌
(2) 確診時(shí)無(wú)轉(zhuǎn)移病灶;無(wú)其他腫瘤病史;
(3) 排除其他原位癌。
二.實(shí)驗(yàn)方法
采集上述訓(xùn)練集180例患者的手術(shù)切除癌組織標(biāo)本:利用Qiagen 公司的Rneasy Plus Mini Kit,按照試劑盒說(shuō)明,抽提RNA樣本。抽提后的RNA,利用NanoDrop 2000 光譜儀定量檢測(cè)提取的總RNA 的濃度及質(zhì)量;所提取的RNA樣本凍存于-80℃的深低溫冰箱中。
用美國(guó)Affymetrix公司的GeneChip Human Transcriptome Array 2.0 (HTA2.0) 芯片檢測(cè)胃癌的轉(zhuǎn)錄組,該芯片可檢測(cè)出超過(guò)285000個(gè)轉(zhuǎn)錄本;按照Affymetrix HTA2.0芯片操作說(shuō)明規(guī)定的標(biāo)準(zhǔn)操作步驟,對(duì)所提取的RNA 樣本進(jìn)行全轉(zhuǎn)錄組表達(dá)譜的檢測(cè)。
讀取芯片數(shù)據(jù)后,將原始信號(hào)值小于1的都以1替代,以芯片內(nèi)部參考基因表達(dá)為參照對(duì)結(jié)果進(jìn)行標(biāo)化處理;將獲得的表達(dá)譜數(shù)據(jù)和患者的臨床隨訪信息相關(guān)聯(lián),利用COX 比例風(fēng)險(xiǎn)回歸模型(BRB-Array Tools) 計(jì)算每個(gè)lncRNA 與RFS的相關(guān)性。
將上述的lncRNA通過(guò)COX 比例風(fēng)險(xiǎn)回歸模型,構(gòu)建預(yù)后預(yù)測(cè)模型,得出RS 計(jì)算公式: ,其中,為每個(gè)RNA 在兩分類方法中的賦值,為每個(gè)lncRNA序列 的權(quán)重系數(shù)。
根據(jù)計(jì)算得出的RS 值,將患者劃分為高危和低危,進(jìn)而判斷患者復(fù)發(fā)風(fēng)險(xiǎn)大小。通過(guò)COX 多因素比例風(fēng)險(xiǎn)回歸模型及ROC曲線對(duì)所構(gòu)建RNA 模型的預(yù)測(cè)效能進(jìn)行評(píng)價(jià)。
三.實(shí)驗(yàn)結(jié)果
共檢測(cè)了訓(xùn)練集180例胃癌組織。
其中11個(gè)lncRNA序列基本信息如表1 所示:
表1.納入模型的lncRNA 基本信息。
<110> 上海厚承醫(yī)學(xué)科技有限公司
<120> 一種預(yù)測(cè)胃癌復(fù)發(fā)和鉑類藥物反應(yīng)的lncRNA模型及其構(gòu)建方法
<130> (編號(hào):)
<160> 11
<210> 1
<211> 616
<212> DNA
<213> BF238392
<400> 1
gaccctatttccttatgcatactgctaactgccaaaatattctctctctgtccacctgaccctccattcctgcttcctgtgacctgggaatggagaattaccctctgactccttgtgccctccctgctcaggatatcagcacagagggacgaaggcaatgtgcctaccctgcttgagagatgcagaggcctggtgtggagttagcagtattatgagatggggatcagcctggatcactgaatcactgcatgtaggacacactatggagagtttctgtgtgccaagatcagacatggtatatgcaagaataaatgtgtgcgtgaatcaaaccagaggtggtgtttattttttaattactatatggtattctgtgctaacctgactaatccagccagcaaccttacaattctaattatcttgactgtagatcctcccaggtgtgtctatgtacataaactgtgtccctcacttgtgcaaaagctaactatctgtgtttcttttttttccaatcatgtcaacttaatttgtggcttattgtgttatttatggcacgtgaatgttgaattgaagagatatggtgacaatattttacttgcttttgatttcgaaaggaaaagctcttaaaatttactattcactggattattattggcaggttttataaataaggaattacttgtgtcatcctatttaagatcctttcaatggtcatgcctggttttggacatattcttataa.
<210> 2
<211> 443
<212> DNA
<213> AA463827
<400> 2
gttgtatgaggccctgtcttaacagaaatagtgatgtcatcatcatcctctcttatttggtcttgaattgccaccaatcggataaaacctttgaattatttaactcaatatatgttaagtttctactatgtgctgtgtattggtactataaatatgaataagacataagatattacattcaaaaacatcagaatacatgttcttttaaagtataccccaaaacatttaccatgtgttctggggcgcatgttaggctggatcacaaatcaagtctcaagaaatttcaaaagattgaaatcatatagagtatgaattaaaccagaaatcaagtacataaaggtaacaaaaaatttccaaaatgcattaatttaaggaacatacacctcatgacccatgagccaaaaaataaatcacggcaaaattgcaaaaatattttgaaatgaattttaagaaaatacttagcatattaaatac
<210> 3
<211> 338
<212> DNA
<213> H04858
<400> 3
gatttactctcaaacctcctccacccattcccctccatctataacgctttctgcacatctgtaaaaggtatgacttagtgtttggtctgtgaaataaggttaaaaaggaagcatttctttttacattctagctaatgttgatatttttctcatgcttctattagcacataattcagatacattagttttgaagttttgaatcttctctgcttcttgagggctctctgttctagatcaacatgatctgtggaacaccagccaagtcctggggcagaaccctccccgttgtccaaatattactgaatcagttgagttttctctgttgtcaatggaattattccacatgtttctttggctacattttttttgggnttctgttcacagtaantttggccttgtttttaaaaacttctattagga
<210> 4
<211> 471
<212> DNA
<213> AA041523
<400> 4
tttggacttttaaattttattacttttaaattttgtttccatagtttacttttatttcaatggttttggttacatggataagttctttagtgatgatttttcagattttggtgtacttgtcaccctgctttaaatgaatatgacttgggttcttctggcatttttattcctgtaaaataaacagtgtctgcacatcgctaattagaaaagtgttcgacacagagtgtggattccattgtcctcagaaaacccgtcagaaggaggagcaggtagggaaatgatgttcctggaagtgcagtcacttttttaagcttacacaactcctagcctgcaggactggatttgtaacctgaggctgcctgactctaaacccttttgggctgctcacaggagcctcccaaagtccttgtttttgtctctgccttaagacctccgtggagaatcccgcacaaccaagctccagcaatggaa
<210> 5
<211> 674
<212> DNA
<213> BE621082
<400> 5
ggctttgccaggcccaccggagaaaactgacgacccgtttctgtaatccttatgggagaccaaccttgtgcctccgggagatccactctcccacctggaaacgcacgggaagccaagcctccaaaaaagcgctgcctcctcgctccgcgttgggattatccggaaggaactcccaacggaggtagtaccactctaccctccgcacctcctcctgcatcagccggcctgaagtcgcaccctcctcctccggagaagtagagaaataaatttctcccaccctaaaccagtctttgagtgattgcagtatgactccatttccctggtgcattcatataatagttcacctggtgaaaacaatgaagattatttacaatgctaccctgctttttctggtgtcctgaacctggaagttgtgctttttaagtcttatgatgtaatcagcgcgatttcacttcctgaatttcgatgaattctaagacatgggcaagatcgggttgtaagacctctgagatttaaggccatgccctggatcatggtgaacttaccaaagcaaacaatgcctgtgagatggtcctgcagcagacaacccagtgaactctttggtgacatcctgttctgtgtataactttatattcctattaatccattaaggcccaataagttgtctctaaaaaaacacaaacacacaaaggggggggctaaagtacccggagggccagtacctacccgtttctggcaagggcccaatggagggaataagacagcggcgcgcacacggtcggcgcgcaatgcctgggttggagactctcgggggcctgggccaccaataccggaaatagttggcaccagggaagtgtta
<210> 6
<211> 1950
<212> DNA
<213> BC035722
<400> 6
ctgcagggag gacctcactt ggccaagttc tccatatgcc ttcagatgga gactgagggc
agaggagagt gcagcttatc caagatctca aggctagtaa ttggtgagaa aattctgcac
agaaccattc ccagtggtga gactgttttt gtccttcagc ccgggaaggg cagacctggc
tccctccttt tatttgcaag cctcaaaacc atcaagacag ggttaaagat gccccactcc
aaaaatggtt gcaagctcaa cacggctcct ttccagacac tcgaagggcg cggaccttcg
ctgagacgcc acccacgcaa gtggaggaag cacttgcgcc actgctgagc ggttggaagg
ggaacactgc agcgatgacc cacgagtgtc aacgagacca ggtgcccatt agggaaacag
agatggagaa gaaatcacgc gccaaggtct gaaattcggc gtggctctca ctcgacatct
ccccattgtc gccacccgtg cacccgcctg cagcggcgca ccgggctcgg tgctgcacct
gcctcctggc gcctgcgcca ctgcccccgc gcgggtccca ccgcgcagga cgccccttcc
tgcttccaac gtctgctgtg gatcacacgc ggtcgctgcc aaagcctcca tttcggttct
gacccagtga ctttggggac gcccagggag gagatgtgga gaggatgtgg ccaaggtgaa
ccagccagtg taagtgctaa tgcttctggc ttctcggtaa cacctaccct gccccaccac
ccaaatcggg ccttgatcaa aaaagaagcg tcttgacaat acatttttag acataaataa
gttgaaggtg cccacggagg gaggttgaaa acatttgatt atcaggacag agtagaagcc
tgtttggctc atccttttgg ccagctctaa agcagcagtg gacacttctt tgcgattttg
caaggatgtt tgtgaatgta ctttgtaact cctagaaaat aggcaaaaaa ccgtgagtgg
atgtagtcgc accgctggca cctgtaagaa cgcgccctaa agctgtggaa ctgctattca
ggttccaggc acacgtctca agcctcaaac ctccaagagt tgccttagct gctcatttta
ctggtaagaa gacggaggtc aagcctgaag atagtggctc tgctgttttc ttaggctgct
tgaagcttta gataagcagg aaaattccat caaagaaatc cctgtatgta aattgggaga
aaaagatatg atgaatatta atgcagaggc ctctgaacaa atggaacctc cattttcaca
tccagcacag gatcatttgc agccagacaa cctgagagtc aaccccaact ctacctttta
ctaattgcat gatattgggc ctcagtttgc tcatctgtaa attgggtgca gtgatagaat
ctatcccaca gggttttgct gagcattaaa tgagtttaaa cttgtagatg gcttagaata
atgcctggca tgtagcaagt acgcagttac tggcgcctgg tgtatatagt aagtactcga
tatacattaa ctatttttca aagacaccac agctcacctg ggaaggaatc tcaggtattt
gcctgagatt caagcaaaca aatatggaag ctaccaaagg ctcatgaagc ctgaaggatc
cttgcagaga gatgttctaa atgttgccta gaaaggcagt ttggagggag gcctctccag
tcagaggtct ggatgctaag tttagctctg ccacatatta gccaggtaat tttgaagtaa
taaacaatct ctttgtgcct ccatttcttc ttgtgtaaaa tgaggggctg ttgtgaagat
taaataaata catgtaaagc atttaaagcc agacctggca gaaaaaaaaa aaaaaaaaaa
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa
<210> 7
<211> 1772
<212> DNA
<213> BC037827
<400> 7
agcgggagtg tgagtgtgtc tctgtgtgtg taggggtcga ggtggggggg gtccgtgttt
gcgatctgaa cctttggtac ctacaaggag ggtgtctcac cgaacggtag ctaaaacctc
accagaaccg cgcggaagtg agaagtcgcg gccaaaggcg cccgcagaag cctcctctct
gggccggacc ccagcccgag cggccgaaag gagccccccg cccggatcac agctgctgca
gctgccgctg aaattcgctg tggccgctgc atcttcccgc tttaatccca gacctccagt
cattgggcag ctcctcagag gcaagaagtc aacaccatgg caacccgaca agcctatcaa
atcaccggct ggcgtgacag cagcaacact gcaggcagga gtgggctggg cggaagagca
gagtggccac tgcgctcaga agtttacaag gaaaggggaa atgtctgaaa tggagattgc
acaatcctgt cttgaagcag aagactcagc tagagcacat ctggaaacac ctggcactcc
tcaatagaat tcaaatgcta ttttaaaaga gtccatttct aagaagatgt ggttcgaaca
tacagagcta cataatatga gtaaaatagg acctaacagt agtgttctcc agcattgctc
tgcctttcct tttctggatg taacaacatt actaagaaag gaagaaaaag caaaaatctg
ctctcgggga gattccagaa tgttggaaag ccccaaatgg aagtctctgc tttggttaca
ggacataagg tttaataaat aaaaagatgc tcatctggga tgctgcacca attatcatgt
actaaataag gttacctact tcactctcca ggtagaaatg tctatcataa gcatgtgcca
cagaaggtct ctcaagtatc attattggct gtgttgaatt ttgtttttag ttctctttta
taaggtctgt agtcttactt tcagtgagga agtgttttct caggttctca agaaagtaac
aaaatgccag cattgtcaag gtcaccattg ccactgaatt atcttactgt ctgattattc
catcttcctc tgcatcatat tagcctgatg actacattct aattatttaa agcgttatgt
aaatcaaagc agtaaatgta atttctagtc ttactagata tcatgtacat taggtcgaat
aactctagaa atgtcgtcat aatcatgtca tgcctaatga tgacctactc agcccctgcc
aacatcattc aattactcat ttcagtattg atttttctca tgcctctctt catggcattt
aaacagccct cacatctccc cttttactga ggtgtaatgt tgtataatga cagagatgct
ttgcttccca gattcataat gttacactct gtttcaaatc cttttggaga caaattgggg
aatcaatata taaataatga cacacttatt tttaattaaa atcactgctt tcacagaaat
ggtatattaa aattattttt gctaaaaaaa ttttaaatac ctatgtacga taaaaagact
gccaatcatt gggatcaaga atataatttg ccccaaataa cttttctgta aaagtagaat
tcttaatgga aaatagatta atacatataa tttcaagatc taaccttaaa aatggaaata
atgtgtccat ttttaaaaat aaatcatatt tacataaaaa aaaaaaaaaa aaaaaaaaaa
aaaaaaaaaa aaaagaaaaa aaaaaaaaaa aa
<210> 8
<211> 249
<212> DNA
<213> H11436
<400> 8
tttttttttttttttttttttttttnaaacaaataagggctttattttctgtatgtcatg
aagggaaaagagggaggcagtccaggtntaatatgctggccttcgaatgccatcagnttt
tcatcccaccatnttcagcatgtagattttttccncatatgtnttgccttgtgattacta
gatggctgctcggcttctggcattgcatcagcattccagaaaggaagaagaggaaaggct
aaagcagtagttctcagctggaggtgattttgccaccaggggcacatttgggcaatatat
gggagatatttttggttgtcacaacttgcggaggggggcatgggttgctccnggggatct
aaatttgtagaagcccaaagatgctgctaaaacatccnaacattttttaggggccaaanc
ccccggagccaggattttttctgggcccaaagtttttngagaaaccccggggt
<210> 9
<211> 1620
<212> DNA
<213> AF035291
<400> 9
gccgtgcctg caggacttcc cttcgcttgg gcgcaagccg gcgattagcc tggtccccta
ggacatctcc agggctccgg ggaacctctc ctgcgcaggc ttggccctgc ctcctccaag
cgtccgagtc tttttcggct tttcgtgagc ctcagagagg gacgtttcct gccaacgctg
ctgcgaagga aagtttgggc ggcgttatcc tgactgcctt cctcgccagc gccggcgagc
agcttgggga cacagccgac gcccgggcat cctccccgac gaccccccgg agcgctccca
gttcagactc ctttccgaga agcgcgcaga agtgacagcc ccggagcttc gttccggtgt
aggtgtgggg atgcgccgca aggcaggagg ggaaggcgct ccagttgaag ggggcacccc
ggggcccgcg ccgactcctc ccggcgcagc cttggctcgc cggagtcgcg ggtcggaggc
tggcgccgct gcccgccgac cagcaccctg gcgccaggcg cccggctcca cgccgcaccc
ttggcgacgc tgtgcgaggg gctctagcgc ccgccgcggc gcagtctcgt gaacccccgc
tccaattttt tcctacggag gcgcagagga gggtgaattc gcgctctcct tcccgacgcc
ccggcttctg ggagcgtcag agcaacggaa gtacgtacag gaggaccgag agcagcaggg
aagtttggcg gtgggctggg tcggcggcga agattccctg ccgtgcgctg ccccctcgtg
gccgctttgc gttcccgtcg ggaagggctg ggttccagtc cagggcccag cacaaaccag
gattggttgg acgctgcaca gcgagttcag tcagggctaa catcagaaga gtcgtggggg
gcctgcctat cggccagcct gtccttgtgg tttgtgaagt tgtatgatct ttctgttatt
attaaggaaa aaagtagtat ttgttgaggc taaaaggcca agagcgtgct atatattatt
taatcctcta aacagctctg ccagataatt attttattta tttatattta cttccatagc
tttagacagg atctcgttct gtccggcagg ctagagcgcg gggtgctatc acggctcact
gcagcctcaa actcttgggc tcaagccatc ctttcacctc agcctcctga atagttgaaa
ctacaggtgc gccaccacgc ctggctaaat ttttaattta aattttttgt agcgacaggg
tctccttatg ttgcccaggc tagtctcaaa ctcctgggct caagagatcc tccaacctca
tcttcacaaa gtgctgggag tacaggcgcc agccacggtg cccaacctgt gataattatt
ttaaactcat tttacaaatg aggaaagtga tattcatact tgtaaagcca ttggggctga
attttcattt ttgtatccac agaactaaca cataaagttt acatgccatt agaatgtaag
ctctctgtaa gctacagatc ttttctactg taatatcctt agtgcctagg gcagtgacta
gcatatagta ggtgttcaat aaatatttgt agaattaatg aaaaaaaaaa aaaaaaaaaa
<210> 10
<211> 410
<212> DNA
<213> AI056187
<400> 10
atcagtacaaataaaattataatgaaaagtctatgaagataatttgttctcagatgccct
tcacatatagcaattaattcacaaatgatgagtcactcatgtgccttcatgaaggcaggc
cctcaagagacccgcaacagaaaggaaagccaccgactggagagaacctgcttcctgagc
cccaccaagttccaaaaaggagaatggggcttcgtcctcaccctcaaggagttgccaaac
tgggcttggttattattcacacttgaaaagaatgaggaaggtcagccagtcccctccagg
tcgctcgggcttcctccaagctcctcttggttcaaatttgctgtgtcctccagccggcat
ctctcctctgttccgtaactgacagggcagcgaggtagcttccggatgactcctcccgcc
atggttcttccgtccatcagctcttccttcctcaactctggg
<210> 11
<211> 1904
<212> DNA
<213> AK026189
<400> 11
gtctgctccg ggacttggaa caaaaggggg aactctgatg aactctcttt cctcccctct
cccccggacg ccggggtatc tccctctcgc aactttgccg ccccgacttt ctctgctgtc
aggccgggaa aaagtgtccg aacgcctcgt ggactgcagc gggggaaatg tcccttaaaa
gtgcgacgaa gtggggaaga aggtgtaatt actattatca gcatctagaa agcatcatga
atttgctgga gtacttccta gcactgacct ccttcattct gcgttgttct tactggatct
ttccatcagc caacaatatg gaagtaccaa tacaaggtca aatcattcct ggattcatct
ggagttgctt aaaagttaaa tcattggaat ttttgatgat accttttcta tatggattac
aatttgatcg ctgggaattc tccaccttaa agaagtaccc tcaggtgact acagatgtgt
taacacccag catgttccgg taggagactt tctggatggg gaagatttcc aggaattggc
aacaagctca tttcactggt gggtttgctg aagcattatc acaagacagt cagaatgact
gatgagtgct cttcaggtgt gaatcatggc aatacagtga aagacagtga tttactgctt
ttgagggcgt gcatgtatat gattaacgga tggaagtgca ggactccaag atttacttcc
ttccctttcc agcagaatta cctgagacga gtaaaatcta ctggtggagt cactccatta
ttcttatctg tggagatcta gatcttgatt tgaaagtttc tgagaaaatc ttcagctcag
acttgagggt caactttacc agctgaagga tctgcattta ctgctcaacc acatctaatt
tgatgtcctc tgcagattta aaatgtgtgc cttctcttcc gtcaccaagt catccctggg
ttactactga acatccttct caattccccc cgacccatgg atggctgttc tccattgtct
gtttcaccag atgtcctcaa aacaaacaga cagaagaagg aagtggctaa tggagctgtg
gagtccaagt gtgactgcca agaggaatcc agcaaagcca aaaagcccaa gcatgtagcc
ctgcccgaag cacgccacac gcatggaaaa cccagaggaa atgagtgagg atcaatggga
agaagagagc cagccaggaa gttgaagatt tgtccaggag cagatagctg aagagagaga
gagagaagag agaacggctt acagctcagg tcctctctcc atgcttagga accactacaa
atgctactgc cttgagtctc attttgtttc cctctggaaa ccacatgtgt accttgtttg
caacagtatg ggctcacagg cagaaggaat tttccttgtc ttggatgaga cttttgactt
ggacttttgg gttaagttct ggagaccaga aggccaaaat caaaagtatg ggcaggcttg
atttctttag aagactccag cggagaactg tgtctccttg cttctgattc tacatctcca
tccatgggcc actgtttcag caacctcagc cagtgcaaca caacctcagc caagaagagt
atgcagagaa aggagtcccc tacctgccac aaaactgttg tctgaaaact gtctcatatt
gtctcaagtt gtcattcatt gtgaattaga cctgtttaac atgtaatctg caacatgctt
cactgtctaa ttttccagag cccctcatat aaggaactgt attattggta taatcatcat
ggtgaagaag ttggtatgtg ggggagagat gacagaaaca gagagtaagt cagagctggc
tgcctgacag ataaaaagga aatgaccaaa aaaaaaaaaa aaaa