專利名稱:用于檢測(cè)原發(fā)性肝癌的癌組織及癌旁組織的基因標(biāo)志物的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于醫(yī)藥學(xué)領(lǐng)域;更具體地,本發(fā)明涉及用于檢測(cè)原發(fā)性肝癌的癌組織及癌旁組織的基因標(biāo)志物。
背景技術(shù):
任何事物的發(fā)生發(fā)展都處于內(nèi)外因共同作用之下,內(nèi)因?yàn)橹?,外因?yàn)檩o?;蜃鳛樯倪z傳介質(zhì),在生物體的生、老、病、死中處于基礎(chǔ)內(nèi)因的地位。絕大部分基因通過(guò)轉(zhuǎn)錄生成核糖核酸mRNA,再翻譯生成蛋白質(zhì)而發(fā)揮生物學(xué)功能。基因的功能雖然主要是通過(guò)蛋白質(zhì)的來(lái)體現(xiàn),但仍可以通過(guò)基因的轉(zhuǎn)錄產(chǎn)物mRNA的含量而部分反映。全基因組表達(dá)譜芯片含2萬(wàn)余個(gè)探針,利用DNA雙鏈同源互補(bǔ)的原理在全基因組水平上檢測(cè)樣本中所含各種mRNA的含量,因此可在同一時(shí)間對(duì)待測(cè)樣本中全基因組范圍內(nèi)的基因的轉(zhuǎn)錄水平進(jìn)行檢測(cè),進(jìn)而推測(cè)基因功能。原發(fā)性肝癌是中國(guó)最常見的惡性腫瘤之一,每年新發(fā)病例約占全球50%。肝癌的惡性程度高,發(fā)展迅速,治療困難,病死率高。因此,肝癌的盡早診斷就愈發(fā)顯得迫切。然而,迄今為止,本領(lǐng)域?qū)τ谂c原發(fā)性肝癌密切相關(guān)的基因了解甚少,因此本領(lǐng)域迫切需要進(jìn)一步地分離各種與原發(fā)性肝癌密切相關(guān)的基因,找到對(duì)于診斷肝癌的發(fā)生、轉(zhuǎn)移、復(fù)發(fā)或檢測(cè)有關(guān)的基因標(biāo)志物。
發(fā)明內(nèi)容
本發(fā)明的目的 在于提供用于檢測(cè)、區(qū)分原發(fā)性肝癌的癌組織及癌旁組織的基因標(biāo)志物。在本發(fā)明的第一方面,提供一種多核苷酸集,所述的多核苷酸集包括編碼以下蛋白的多核苷酸(較佳地,由編碼以下蛋白的多核苷酸組成)纖維膠凝蛋白3,⑶209分子,雌激素受體1,⑶5類分子,犬尿酸3_羥化酶,N-?;D(zhuǎn)移酶,載酯蛋白F,鐵調(diào)素抗菌肽,糖原合成酶2,類固醇-5-alpha-還原酶2,促腎皮質(zhì)素激素結(jié)合蛋白,乙醇脫氫酶4,細(xì)胞色素P450家族2亞家族C多肽19,細(xì)胞色素P450家族2亞家族C多肽8,凝結(jié)因子9,細(xì)胞色素P450家族2亞家族C多肽9,金屬硫蛋白1G,磷酸烯醇丙酮酸羧激酶,成膠原結(jié)構(gòu)的巨噬細(xì)胞受體,金屬硫蛋白1H,Afamin,甘氨酸-N-酰基轉(zhuǎn)移酶,視黃醇脫氫酶16,甘氨酸-N-甲基轉(zhuǎn)移酶,甲銨乙內(nèi)酯-高半胱氨酸甲基轉(zhuǎn)移酶,酪氨酸氨基轉(zhuǎn)移酶,載脂蛋白A5,絲氨酸脫水酶,分泌型磷蛋白2,丙氨酸-乙醛酸氨基轉(zhuǎn)移酶2樣蛋白1,細(xì)胞色素P450家族26亞家族A多肽1,17-beta羥留類脫氫酶6同源蛋白和分泌型憐蛋白I。在一個(gè)優(yōu)選例中,所述的多核苷酸集中,編碼所述的纖維膠凝蛋白3,CD209分子,雌激素受體I,CD5類分子,犬尿酸3-羥化酶,N-?;D(zhuǎn)移酶,載酯蛋白F,鐵調(diào)素抗菌肽,糖原合成酶2,類固醇-5-alpha-還原酶2,促腎皮質(zhì)素激素結(jié)合蛋白,乙醇脫氫酶4,細(xì)胞色素P450家族2亞家族C多肽19,細(xì)胞色素P450家族2亞家族C多肽8,凝結(jié)因子9,細(xì)胞色素P450家族2亞家族C多肽9,金屬硫蛋白1G,磷酸烯醇丙酮酸羧激酶,成膠原結(jié)構(gòu)的巨噬細(xì)胞受體,金屬硫蛋白1H,Af amin,甘氨酸-N-酰基轉(zhuǎn)移酶,視黃醇脫氫酶16,甘氨酸-N-甲基轉(zhuǎn)移酶,甲銨乙內(nèi)酯-高半胱氨酸甲基轉(zhuǎn)移酶,酪氨酸氨基轉(zhuǎn)移酶,載脂蛋白A5,絲氨酸脫水酶,分泌型磷蛋白2,丙氨酸-乙醛酸氨基轉(zhuǎn)移酶2樣蛋白I,細(xì)胞色素P450家族26亞家族A多肽1,17-beta羥留類脫氫酶6同源蛋白和分泌型磷蛋白I的多核苷酸分別是序列如 GenBank 登錄號(hào) ΝΜ_003665· 2,ΝΜ_021155. 3,ΝΜ_021155. 3,ΝΜ_005894. 2,ΝΜ_003679. 3,ΝΜ_000015.2, ΝΜ_001638.2, ΝΜ_021175.2, ΝΜ_021957.3, ΝΜ_000348.3, ΝΜ_001882.3,ΝΜ_000670.3, ΝΜ_000769.1, ΝΜ_000770.3, ΝΜ_000133.3, ΝΜ_000771.3, ΝΜ_005950.1,ΝΜ_002591.3, ΝΜ_006770.3, ΝΜ_005951.2, ΝΜ_001133.2, ΝΜ_201648.2, ΝΜ_003708.3,ΝΜ_018960.4, ΝΜ_001713.2, ΝΜ_000353.2, ΝΜ_052968.3, ΝΜ_006843.2, ΝΜ_006944.2,ΝΜ_031279. 2,ΝΜ_000783. 3,ΝΜ_003725. 2 和 ΝΜ_001040058· I 所示的多核苷酸。在本發(fā)明的另一方面,提供所述的多核苷酸集的用途,用于制備測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織的檢測(cè)試劑或試劑盒。在一個(gè)優(yōu)選例中,所述的試劑是特異性擴(kuò)增所述的多核苷酸集中各多核苷酸的引物對(duì);或是特異性識(shí)別所述的多核苷酸集中各多核苷酸的探針。在本發(fā)明的另一方面,提供一種用于測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織的試劑,其是特異性識(shí)別序列如GenBank登錄號(hào)NM_003665. 2,ΝΜ_021155.3,ΝΜ_021155.3, ΝΜ_005894.2, ΝΜ_003679.3, ΝΜ_000015.2, ΝΜ_001638.2, ΝΜ_021175.2,ΝΜ_021957.3, ΝΜ_000348.3, ΝΜ_001882.3, ΝΜ_000670.3, ΝΜ_000769.1, ΝΜ_000770.3,ΝΜ_000133.3, ΝΜ_000771.3, ΝΜ_005950.1, ΝΜ_002591.3, ΝΜ_006770.3, ΝΜ_005951.2,ΝΜ_001133.2, ΝΜ_201648.2, ΝΜ_003708.3, ΝΜ_018960.4, ΝΜ_001713.2, ΝΜ_000353.2,ΝΜ_052968. 3,ΝΜ_006843. 2,ΝΜ_006944. 2,ΝΜ_031279. 2,ΝΜ_000783. 3,ΝΜ_003725. 2 或ΝΜ_001040058.1所示 的多核苷酸的探針,所述的探針的核苷酸序列如SEQ ID N0:l_33任一所示。在本發(fā)明的另一方面,提供一種基因芯片,所述的基因芯片包括固相載體;以及有序固定在所述固相載體上的探針,所述的探針特異性地對(duì)應(yīng)于序列如GenBank 登錄號(hào) ΝΜ_003665· 2,ΝΜ_021155. 3,ΝΜ_021155. 3,ΝΜ_005894. 2,ΝΜ_003679. 3,ΝΜ_000015.2, ΝΜ_001638.2, ΝΜ_021175.2, ΝΜ_021957.3, ΝΜ_000348.3, ΝΜ_001882.3,ΝΜ_000670.3, ΝΜ_000769.1, ΝΜ_000770.3, ΝΜ_000133.3, ΝΜ_000771.3, ΝΜ_005950.1,ΝΜ_002591.3, ΝΜ_006770.3, ΝΜ_005951.2, ΝΜ_001133.2, ΝΜ_201648.2, ΝΜ_003708.3,ΝΜ_018960.4, ΝΜ_001713.2, ΝΜ_000353.2, ΝΜ_052968.3, ΝΜ_006843.2, ΝΜ_006944.2,ΝΜ_031279. 2,ΝΜ_000783. 3,ΝΜ_003725. 2 或 ΝΜ_001040058· I 所示的多核苷酸。在一個(gè)優(yōu)選例中,所述的探針的核苷酸序列如SEQ ID NO :1_33任一所示。在另一優(yōu)選例中,所述的探針含有互補(bǔ)結(jié)合區(qū)和/或與固相載體相連的連接區(qū)。在本發(fā)明的另一方面,提供所述的基因芯片的用途,用于制備測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織的試劑盒。在本發(fā)明的另一方面,提供一種測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織的試劑盒,所述的試劑盒中含有所述的基因芯片。
在一個(gè)優(yōu)選例中,所述的試劑盒中還包括核酸抽提液、顯色液或雜交液。本發(fā)明的其它方面由于本文的公開內(nèi)容,對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
圖1、以MDS算法轉(zhuǎn)換后的癌樣本(紅色點(diǎn)或淺色點(diǎn))和癌旁樣本(藍(lán)色點(diǎn)或深色點(diǎn))在三維空間內(nèi)的散點(diǎn)圖。其中,Cancer表示癌樣本,Pericancerous表示癌旁樣本。
具體實(shí)施例方式本發(fā)明人通過(guò)檢測(cè)同一原發(fā)性肝癌患者來(lái)源的癌組織樣本和癌旁組織樣本的全基因組表達(dá)譜,用統(tǒng)計(jì)學(xué)方法,首次從中篩選出33個(gè)特異性的基因。經(jīng)檢驗(yàn)證明,這些特異性的基因標(biāo)志物可非常有效地用于區(qū)分原發(fā)肝癌患者的癌組織和癌旁組織?;驑?biāo)志物及其用途原發(fā)性肝癌是我國(guó)最常見的惡性腫瘤之一。本發(fā)明人采用芯片雜交的方法得到原發(fā)肝癌的癌組織樣本和癌旁組織樣本的全基因組表達(dá)譜,通過(guò)比較兩種組織的表達(dá)譜,得到癌與癌旁組織間差異表達(dá)的基因。在這些差異基因中挑選出差異尤為顯著的一部分,使用C-SVC分類器(高斯核函數(shù))算法篩選得到分類準(zhǔn)確度為95%的一組分類器(含33個(gè)基因)。由這33個(gè)基因組成的分類器,可預(yù)測(cè)樣本是來(lái)自癌組織還是癌旁組織,其預(yù)測(cè)準(zhǔn)確度達(dá)到87%??梢园堰@33個(gè)基因開發(fā)成小型基因芯片或RT-PCR試劑盒用于肝癌的鑒別診斷。所述的33 個(gè)基因如下FCN3, CD209, ESRl, CD5L, KMO, NAT2, APOF,HAMP, GYS2,SRD5A2, CRHBP, ADH4, CYP2C19, CYP2C8, F9, CYP2C9, MT1G, PCKl,MARCO, MT1H, AFM, GLYAT,RODH-4, GNMT, BH MT, TAT, AP0A5, SDS, SPP2, AGXT2L1, CYP26A1, RODH, SPPl?;诒景l(fā)明人的新發(fā)現(xiàn),可以以上述33個(gè)基因作為測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織的標(biāo)志物(標(biāo)記物)。通過(guò)分析這些基因的表達(dá)情況,從而得知確定待測(cè)組織的類型,為疾病的診斷或預(yù)后提供依據(jù)。可采用各種技術(shù)來(lái)檢測(cè)上述基因的表達(dá)情況,這些技術(shù)均包含在本發(fā)明中?;蛩缴希瑱z測(cè)可以針對(duì)cDNA,也可針對(duì)基因組DNA,或針對(duì)mRNA ;可用的已有技術(shù)如(但不限于)基因芯片技術(shù)、探針雜交技術(shù)、聚合酶鏈反應(yīng)(PCR)、Southern印跡法、DNA序列分析等。作為本發(fā)明的一種選擇方式,通過(guò)定量或半定量的聚合酶鏈反應(yīng)(PCR)法來(lái)分析樣品中上述基因的表達(dá)情況以及表達(dá)量,從而可做出判斷。較佳地,通過(guò)RT-PCR實(shí)現(xiàn)檢測(cè)?;蛐酒鳛楸景l(fā)明的一種優(yōu)選方式,采用基因芯片技術(shù)來(lái)檢測(cè)上述基因的表達(dá)情況。所述的基因芯片上包含針對(duì)上述基因的探針;更優(yōu)選的,所述的基因芯片上包含針對(duì)兩種或兩種以上所述基因的探針;最優(yōu)選的,所述的基因芯片上包含針對(duì)所述33種基因的探針。本發(fā)明所述的基因芯片,包括固相載體和有序固定在所述固相載體上的寡核苷酸探針,所述寡核苷酸探針由10-100個(gè)(更特別的為20-80個(gè);更特別的為30-70個(gè))連續(xù)核苷酸組成。所述探針還可以在其5’端包含一段氨基修飾的1-30聚的聚脫氧胸苷酸(聚dT)。所述固相載體可采用基因芯片領(lǐng)域的各種常用材料,例如但不限于尼龍膜,經(jīng)活性基團(tuán)(如醛基、氨基、異硫晴酸基等)修飾的玻片或硅片、未修飾的玻片、塑料片等。本發(fā)明的基因芯片的制備可采用生物芯片的常規(guī)制造方法。例如,如果固相載體采用的是修飾玻片或硅片,探針的5’端含有氨基修飾的聚dT串,可將寡核苷酸探針配制成溶液,然后點(diǎn)樣儀將其點(diǎn)在修飾玻片或硅片,排列成預(yù)定的序列或陣列,然后通過(guò)放置過(guò)夜來(lái)固定,就可得到本發(fā)明的基因芯片。如果寡核苷酸探針不含氨基修飾,則其制備方法也可參照王申五主編的《基因診斷技術(shù)-非放射性操作手冊(cè)》J. L. erisi, V. R.1yer,P. O. BROWN. Exploring the metabolic and genetic control of gene expression on agenomic scale. Science. 1997 ;278 :680和馬立人,蔣中華主編.生物芯片.北京化學(xué)工業(yè)出版社,2000,1-130。另一個(gè)方面,本發(fā)明還提供了一種通過(guò)基因芯片檢測(cè)人組織中所述基因表達(dá)譜的方法,包括步驟(I)提供分離自人組織的RNA樣品,在所述的RNA上設(shè)置標(biāo)記物;(2)將⑴的RNA與所述的芯片接觸,使所述的RNA與固相載體上的寡核苷酸探針發(fā)生雜交反應(yīng),從而在固相載體上形成“寡核苷酸探針-RNA” 二元復(fù)合物;(3)檢測(cè)(2)形成的二元復(fù)合物的標(biāo)記物,從而確定人組織中相應(yīng)的基因的表達(dá)
-1'TfeP曰。本發(fā)明所述的RNA與芯片之間的固相雜交按照本領(lǐng)域的經(jīng)典方法進(jìn)行,本領(lǐng)域一般人員依據(jù)經(jīng)驗(yàn)容易確定有關(guān)緩沖液、探針和樣本濃度、預(yù)雜交溫度、雜交溫度以及時(shí)間等的最適條件。或者也可以 參照《分子克隆實(shí)驗(yàn)指南》中所述的。然后根據(jù)標(biāo)記信號(hào)在芯片上的位置、強(qiáng)度等信息獲取待測(cè)信息。若擴(kuò)增產(chǎn)物用熒光基團(tuán)標(biāo)記,也可直接用熒光檢測(cè)設(shè)備(如激光共聚焦掃描儀Scanarray3000等)獲取待測(cè)信息。對(duì)核酸樣本進(jìn)行標(biāo)記的標(biāo)記基團(tuán)包括但不限于地高辛分子(DIG)、生物素分子(Bio)、熒光素及其衍生生物分子(FITC等)、其他熒光分子(如Cy3、Cy5等)、堿性磷酸酶(AP)、辣根過(guò)氧化物酶(HRP)等。這些標(biāo)記及其標(biāo)記方法都已是本領(lǐng)域眾所周知的常規(guī)技術(shù),也可以參照王申五主編的《基因診斷技術(shù)-非放射性操作手冊(cè)》J.薩姆布魯克,D.W.拉塞爾主編,《分子克隆實(shí)驗(yàn)指南》,科學(xué)出版社,2002年;馬立人,蔣中華主編.生物芯片.北京化學(xué)工業(yè)出版社,2000,1-130。將上述核酸樣本與基因芯片進(jìn)行雜交時(shí),可以先將基因芯片與預(yù)雜交緩沖液進(jìn)行預(yù)雜交。核酸樣本與基因芯片之間的固相雜交按照本領(lǐng)域的經(jīng)典方法進(jìn)行,本領(lǐng)域一般人員依據(jù)經(jīng)驗(yàn)容易確定有關(guān)緩沖液、探針和樣本濃度、預(yù)雜交溫度、雜交溫度以及時(shí)間等的最適條件。然后根據(jù)標(biāo)記信號(hào)在基因芯片上的位置、強(qiáng)度等信息獲取待測(cè)信息。若擴(kuò)增產(chǎn)物用熒光基團(tuán)標(biāo)記,也可直接用熒光檢測(cè)設(shè)備(如激光共聚焦掃描儀Scanarray3000等)獲取待測(cè)信息。檢測(cè)試劑盒本發(fā)明還提供一種用于檢測(cè)所述基因的表達(dá)情況的試劑盒。所述的試劑盒可用于測(cè)定(或區(qū)分)原發(fā)性肝癌的癌組織及癌旁組織。所述的試劑盒中包括本發(fā)明所述的芯片。更優(yōu)選的,所述的試劑盒中還含有用于標(biāo)記RNA樣品的標(biāo)記物,以及與所述標(biāo)記物相對(duì)應(yīng)的底物。此外,所述的試劑盒中還可包括用于提取RNA、PCR、雜交、顯色等所需的各種試劑,包括但不限于抽提液、擴(kuò)增液、雜交液、酶、對(duì)照液、顯色液、洗液、抗體等。此外,所述的試劑盒中還可包括使用說(shuō)明書和/或芯片圖像分析軟件。所述的芯片圖像分析軟件比如BaiO公司的BaiO ArrayDoctor 2. O, Media Cybernetics公司的Arraypro 4.0。下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件如J.薩姆布魯克等編著,分子克隆實(shí)驗(yàn)指南,科學(xué)出版社,2002中所述的條件,或按照制造廠商所建議的條件。除非另外說(shuō)明,否則百分比和份數(shù)按重量計(jì)算。除非另行定義,文中所使用的所有專業(yè)與科學(xué)用語(yǔ)與本領(lǐng)域熟練人員所熟悉的意義相同。此外,任何與所記載內(nèi)容相似或均等的方法及材料皆可應(yīng)用于本發(fā)明中。文中所述的較佳實(shí)施方法與材料僅作示范之用。實(shí)施例1、RNA樣本的制備組織樣本49對(duì)癌和癌旁組織來(lái)自于原發(fā)性肝癌患者的手術(shù)切除標(biāo)本,這些標(biāo)本來(lái)自于啟東肝癌研究所和浙江大學(xué)第一附屬醫(yī)院。10例正常肝來(lái)自于意外死亡者。上述所有標(biāo)本的取得均通過(guò)上海市政府授權(quán)的WHO合作組織倫理委員會(huì)的同意。組織樣本的臨床資料包括性別、年齡、腫瘤大小、病理 分級(jí)(Edmonson)、肝硬化與否、轉(zhuǎn)移與否、復(fù)發(fā)與否、HBV和HCV感染情況等。所有患者術(shù)前都沒(méi)有接受化療,術(shù)后隨訪最長(zhǎng)達(dá)60個(gè)月?;蛐酒蚪M表達(dá)譜芯片,采用博奧生物有限公司(http://www.capitalbio.com)的晶芯 人類全基因組寡核苷酸微陣列芯片V1. O (雙通道芯片),含22000余個(gè)基因探針。RNA樣本(組織總RNA提取)1.樣品的收集和保存離體組織切割成小塊后立即置于液氮中速凍,然后移至-80°C冰箱保存。2.組織塊破碎組織塊放于液氮中研磨成粉,每克組織加入ImlTrizol (Invitrogen 公司)。3.總RNA抽提按每毫升Trizol加O. 2ml的氯仿,劇烈振蕩15秒,室溫孵育2_3分鐘;4°C,10,000g離心15分鐘;將無(wú)色上清液移入新的離心管中,加O. 5ml異丙醇,室溫孵育10分鐘,IOOOOg 4°C離心10分鐘;倒掉上清,O. 75ml75%乙醇洗滌,4°C,7,500g離心5分鐘;倒掉上清,室溫干燥RNA沉淀5-10分鐘(勿使RNA完全干燥),用DEPC處理后的無(wú)RNA酶H20溶解沉淀。4.分光光度計(jì)法定量RNA,并取少量Total RNA進(jìn)行電泳,檢查RNA是否降解。實(shí)施例2、篩選差異顯著的基因49例癌樣本與正常樣本(10例混合)、49例癌旁樣本與正常樣本(10例混合)分別用cy3和cy5兩種熒光染料標(biāo)記,與全基因組表達(dá)譜芯片上的探針競(jìng)爭(zhēng)性雜交。雜交后的芯片用晶芯 LuXScan 10K微陣列芯片掃描儀掃描獲得結(jié)果圖像,再通過(guò)其隨機(jī)附帶的LuxScan 3. 0通用微陣列圖像分析軟件對(duì)雜交結(jié)果定量。由此,得到49對(duì)癌樣本對(duì)正常樣本(癌/正常,Cancer/Normal,C/N)和癌旁樣本對(duì)正常樣本(癌旁/正常,Pericancerous/Normal, P/N)的表達(dá)譜數(shù)據(jù)。將上述49張癌/正常芯片結(jié)果和49張癌旁/正常的芯片結(jié)果首先用LOWESS (局部加權(quán)回歸分析)歸一化。經(jīng)歸一化后的癌/正常(C/N)、癌旁/正常(P/N)的芯片結(jié)果取以2為底的對(duì)數(shù)(log2X),使用經(jīng)配對(duì)T檢驗(yàn)方法(因?yàn)榘┙M織和癌旁組織來(lái)源于同一個(gè)病人)校正后的隨機(jī)方差模型(RVM)篩選得到癌/癌旁(C/P)的顯著性差異基因。為驗(yàn)證基因差異的顯著性不是由巧合引起的,本發(fā)明人引入上述T檢驗(yàn)方法后再對(duì)數(shù)據(jù)隨機(jī)重排1000次,檢測(cè)一個(gè)基因在通過(guò)前述方法篩選后被檢定為顯著性差異基因的假陽(yáng)性率(FDR, False Discovery Rate)。在上述統(tǒng)計(jì)學(xué)方法中,只有P值< 0. 05的基因才會(huì)被篩選為顯著性差異基因。分類器(可區(qū)分兩類組織的基因)的篩選與驗(yàn)證為尋找可區(qū)分兩類樣本(癌與癌旁)的基因,本發(fā)明人使用Matlab軟件的Lib-SVM工具包,使用C-SVC (參數(shù)C的支持矢量分類器)和V-SVC (參數(shù)V的支持矢量分類器)兩種方法,并各自米用四種核函數(shù)(linear kernel,ploy kernel, gauss kernel, tanhkernel),共計(jì)8種方法構(gòu)建SVM分類器。SVM(support vector machine,支持矢量機(jī))分類器是兩類樣本間差異基因的差異倍數(shù)的對(duì)數(shù)值的非線性函數(shù),它尋找能最大化兩類樣本間距離的超平面,因而可以最好地區(qū)分兩類樣本。為檢驗(yàn)分類器的分類準(zhǔn)確度,本發(fā)明人選用在所有的交叉檢驗(yàn)方法中最穩(wěn)定的10乘10折交叉檢驗(yàn)法。10折交叉檢驗(yàn)法,是將樣本總體分成10個(gè)子份,每次選I個(gè)子份作為測(cè)試數(shù)據(jù)集,其余9個(gè)子份作為訓(xùn)練數(shù)據(jù)集,重復(fù)10次(每次以不同的一個(gè)子份作為測(cè)試數(shù)據(jù)集)。如此得到的10個(gè)檢驗(yàn)結(jié)果相結(jié)合形成對(duì)分類器分類準(zhǔn)確度的一個(gè)評(píng)估值。再由8種算法中選擇分類準(zhǔn)確度最高的一種作為最佳分類器。為直觀地顯示同組樣本間的相似以及不同組樣本間的相異,本發(fā)明人在3維視效中引入多維標(biāo)度法(multidimensional scaling,MDS)。MDS算法以被分類器(一組基因)定義的樣本-樣本間相似度矩陣為基礎(chǔ),確定每一個(gè)樣本在低維空間內(nèi)的位置,并使之適應(yīng)于3維視效。在此3維空間中,兩樣本越接近,則它們?cè)较嗨?;反之,若兩樣本相距越遠(yuǎn),則它們之間越不同。結(jié)果篩選差異基因時(shí)以P值<0.05為界。癌樣本對(duì)癌旁樣本(癌/癌旁,Cancer/Paracancerous, C/P),共有1469個(gè)顯著差異基因,其中顯著上調(diào)(癌高于癌旁)的有621個(gè)基因,顯著下調(diào)(癌低于癌旁)的有848個(gè)基因。在進(jìn)行分類器篩選時(shí),為確保達(dá)找到的分類器達(dá)到最佳分類精度,以差異基因的P值<0. 000001為界進(jìn)一步選出差異性尤為顯著的基因,作為分類器候選基因。套入8種SVM分類器算法并使用前述的10乘10折的交叉檢驗(yàn)來(lái)驗(yàn)證分類器的分類準(zhǔn)確度。經(jīng)1000次數(shù)據(jù)置換的10乘10折交叉驗(yàn)證得到分類器后,為測(cè)試該分類器的預(yù)測(cè)能力,本發(fā)明人隨機(jī)挑選15個(gè)樣本作為未知樣本,以該分類器對(duì)每個(gè)樣本的組織來(lái)源(癌或癌旁)進(jìn)行預(yù)測(cè),觀察其預(yù)測(cè)準(zhǔn)確度。綜合8種算法,由C-SVC(gauss kernel,高斯核函數(shù))這一算法得到的分類準(zhǔn)確度最高。這一算法得到的用于區(qū)分癌與癌旁樣本的33個(gè)基因組成分類器(見表I)。表1:組成分類器的33個(gè)基因
權(quán)利要求
1.一種多核苷酸集,其特征在于,所述的多核苷酸集包括編碼以下蛋白的多核苷酸 纖維膠凝蛋白3,CD209分子,雌激素受體1,CD5類分子,犬尿酸3-羥化酶,N-?;D(zhuǎn)移酶,載酯蛋白F,鐵調(diào)素抗菌肽,糖原合成酶2,類固醇-5-alpha-還原酶2,促腎皮質(zhì)素激素結(jié)合蛋白,乙醇脫氫酶4,細(xì)胞色素P450家族2亞家族C多肽19,細(xì)胞色素P450家族2亞家族C多肽8,凝結(jié)因子9,細(xì)胞色素P450家族2亞家族C多肽9,金屬硫蛋白1G,磷酸烯醇丙酮酸羧激酶,成膠原結(jié)構(gòu)的巨曬細(xì)胞受體,金屬硫蛋白1H, Afamin,甘氨酸-N-?;D(zhuǎn)移酶,視黃醇脫氫酶16,甘氨酸-N-甲基轉(zhuǎn)移酶,甲銨乙內(nèi)酯-高半胱氨酸甲基轉(zhuǎn)移酶,酪氨酸氨基轉(zhuǎn)移酶,載脂蛋白A5,絲氨酸脫水酶,分泌型磷蛋白2,丙氨酸-乙醛酸氨基轉(zhuǎn)移酶2樣蛋白1,細(xì)胞色素P450家族26亞家族A多肽1,17-beta羥留類脫氫酶6同源蛋白和分泌型磷蛋白I。
2.如權(quán)利要求1所述的多核苷酸集,其特征在于,編碼所述的纖維膠凝蛋白3,CD209分子,雌激素受體1,CD5類分子,犬尿酸3-羥化酶,N-?;D(zhuǎn)移酶,載酯蛋白F,鐵調(diào)素抗菌肽,糖原合成酶2,類固醇-5-alpha-還原酶2,促腎皮質(zhì)素激素結(jié)合蛋白,乙醇脫氫酶4,細(xì)胞色素P450家族2亞家族C多肽19,細(xì)胞色素P450家族2亞家族C多肽8,凝結(jié)因子9,細(xì)胞色素P450家族2亞家族C多肽9,金屬硫蛋白1G,磷酸烯醇丙酮酸羧激酶,成膠原結(jié)構(gòu)的巨噬細(xì)胞受體,金屬硫蛋白1H,Afamin,甘氨酸-N-?;D(zhuǎn)移酶,視黃醇脫氫酶16,甘氨酸-N-甲基轉(zhuǎn)移酶,甲銨乙內(nèi)酯-高半胱氨酸甲基轉(zhuǎn)移酶,酪氨酸氨基轉(zhuǎn)移酶,載脂蛋白A5,絲氨酸脫水酶,分泌型磷蛋白2,丙氨酸-乙醛酸氨基轉(zhuǎn)移酶2樣蛋白1,細(xì)胞色素P450家族26亞家族A多肽1,17-beta羥留類脫氫酶6同源蛋白和分泌型磷蛋白I的多核苷酸分別是序列如 GenBank 登錄號(hào) ΝΜ_003665· 2,ΝΜ_021155. 3,ΝΜ_021155. 3,ΝΜ_005894. 2,ΝΜ_003679.3, ΝΜ_000015.2, ΝΜ_001638.2, ΝΜ_021175.2, ΝΜ_021957.3, ΝΜ_000348.3,ΝΜ_001882.3, ΝΜ_000670.3, ΝΜ_000769.1, ΝΜ_000770.3, ΝΜ_000133.3, ΝΜ_000771.3,ΝΜ_005950.1, ΝΜ_002591.3, ΝΜ_006770.3, ΝΜ_005951.2, ΝΜ_001133.2, ΝΜ_201648.2,ΝΜ_003708.3, ΝΜ_018960.4, ΝΜ_001713.2, ΝΜ_000353.2, ΝΜ_052968.3, ΝΜ_006843.2,ΝΜ_006944. 2,ΝΜ_031279. 2,ΝΜ_000783. 3,ΝΜ_003725. 2 和 ΝΜ_001040058· I 所示的多核苷酸。
3.權(quán)利要求1或2所述的多核苷酸集的用途,其特征在于,用于制備測(cè)定原發(fā)性肝癌的癌組織及癌旁組織的檢測(cè)試劑或試劑盒。
4.如權(quán)利要求3所述的用途,其特征在于,所述的試劑是特異性擴(kuò)增權(quán)利要求1或2所述的多核苷酸集中各多核苷酸的引物對(duì);或是特異性識(shí)別權(quán)利要求1或2所述的多核苷酸集中各多核苷酸的探針。
5.一種用于測(cè)定原發(fā)性肝癌的癌組織及癌旁組織的試劑,其是特異性識(shí)別序列如GenBank 登錄號(hào) ΝΜ_003665· 2,ΝΜ_021155. 3,ΝΜ_021155. 3,ΝΜ_005894. 2,ΝΜ_003679. 3,ΝΜ_000015.2, ΝΜ_001638.2, ΝΜ_021175.2, ΝΜ_021957.3, ΝΜ_000348.3, ΝΜ_001882.3,ΝΜ_000670.3, ΝΜ_000769.1, ΝΜ_000770.3, ΝΜ_000133.3, ΝΜ_000771.3, ΝΜ_005950.1,ΝΜ_002591.3, ΝΜ_006770.3, ΝΜ_005951.2, ΝΜ_001133.2, ΝΜ_201648.2, ΝΜ_003708.3,ΝΜ_018960.4, ΝΜ_001713.2, ΝΜ_000353.2, ΝΜ_052968.3, ΝΜ_006843.2, ΝΜ_006944.2,ΝΜ_031279. 2,ΝΜ_000783. 3,ΝΜ_003725. 2 或 ΝΜ_001040058.1 所示的多核苷酸的探針,所述的探針的核苷酸序列如SEQ ID NO 1-33任一所示。
6.一種基因芯片,其特征在于,所述的基因芯片包括 固相載體;以及 有序固定在所述固相載體上的探針,所述的探針特異性地對(duì)應(yīng)于序列如GenBank登錄號(hào) ΝΜ_003665· 2,ΝΜ_021155. 3,ΝΜ_021155. 3,ΝΜ_005894. 2,ΝΜ_003679. 3,ΝΜ_000015. 2,ΝΜ_001638.2, ΝΜ_021175.2, ΝΜ_021957.3, ΝΜ_000348.3, ΝΜ_001882.3, ΝΜ_000670.3,ΝΜ_000769.1, ΝΜ_000770.3, ΝΜ_000133.3, ΝΜ_000771.3, ΝΜ_005950.1, ΝΜ_002591.3,ΝΜ_006770.3, ΝΜ_005951.2, ΝΜ_001133.2, ΝΜ_201648.2, ΝΜ_003708.3, ΝΜ_018960.4,ΝΜ_001713.2, ΝΜ_000353.2, ΝΜ_052968.3, ΝΜ_006843.2, ΝΜ_006944.2, ΝΜ_031279.2,ΝΜ_000783. 3,ΝΜ_003725. 2 或 ΝΜ_001040058.1 所示的多核苷酸。
7.如權(quán)利要求6所述的基因芯片,其特征在于,所述的探針的核苷酸序列如SEQIDNO 1-33任一所示。
8.權(quán)利要求6或7所述的基因芯片的用途,用于制備測(cè)定原發(fā)性肝癌的癌組織及癌旁組織的試劑盒。
9.一種測(cè)定原發(fā)性肝癌的癌組織及癌旁組織的試劑盒,其特征在于,所述的試劑盒中含有權(quán)利要求6或7所述的基因芯片。
10.如權(quán)利要求9所述的試劑盒,其特征在于,所述的試劑盒中還包括核酸抽提液、顯色液或雜交液。
全文摘要
本發(fā)明涉及用于檢測(cè)原發(fā)性肝癌的癌組織及癌旁組織的基因標(biāo)志物。本發(fā)明人通過(guò)分析原發(fā)性肝癌患者的癌組織樣本和癌旁組織樣本的全基因組表達(dá)譜,用統(tǒng)計(jì)學(xué)方法,首次從中篩選出33個(gè)特異性的基因。經(jīng)檢驗(yàn)證明,這些特異性的基因標(biāo)志物可非常有效地用于區(qū)分原發(fā)肝癌患者的癌組織和癌旁組織。
文檔編號(hào)C12Q1/68GK103060351SQ20111032640
公開日2013年4月24日 申請(qǐng)日期2011年10月24日 優(yōu)先權(quán)日2011年10月24日
發(fā)明者何祥火, 魏霖, 梁琳慧, 顧健人 申請(qǐng)人:上海市腫瘤研究所