用于肺癌分類的方法
【專利摘要】本發(fā)明提供用于各種肺癌亞型的鑒定、分類和診斷的特定核酸序列。本發(fā)明允許在沒有進(jìn)一步操作的情況下根據(jù)肺癌的miR表達(dá)譜對(duì)其進(jìn)行準(zhǔn)確分類。利用自200多個(gè)原發(fā)性肺癌的福爾馬林固定石蠟包埋的(FFPE)切除術(shù)樣品、細(xì)針抽吸術(shù)(FNA)樣品和細(xì)針活檢(FNB)樣品生成的微RNA微陣列數(shù)據(jù),鑒定對(duì)于各種肺癌亞型顯著不同的微RNA表達(dá)譜。
【專利說明】用于肺癌分類的方法
[0001]相交申請(qǐng)的交叉引用
根據(jù)35 U.S.C.§ 119(e)的條款,本申請(qǐng)要求2011年3月28日提交的美國臨時(shí)申請(qǐng)?zhí)?1/468,077的優(yōu)先權(quán),所述臨時(shí)申請(qǐng)通過引用以其整體結(jié)合到本文中。
發(fā)明領(lǐng)域
[0002]本發(fā)明總的來說涉及與特定類型的肺癌有關(guān)的微RNA (microRNA)分子以及與之有關(guān)或來源其中的各種核酸分子。
[0003]發(fā)明背景
近年來,微RNA (miR)作為調(diào)節(jié)RNA的新的重要類別而出現(xiàn),其對(duì)各種各樣的生物過程具有重大影響。
[0004]這些小的(通常長(zhǎng)18-24個(gè)核苷酸)非編碼RNA分子可通過促進(jìn)RNA降解、抑制mRNA翻譯并且還影響基因轉(zhuǎn)錄,來調(diào)節(jié)蛋白質(zhì)表達(dá)模式。miR在例如發(fā)育和分化、細(xì)胞增殖控制、應(yīng)激反應(yīng)和代謝等各種過程中起關(guān)鍵作用。已發(fā)現(xiàn)許多miR的表達(dá)在多種類型的人類癌癥中發(fā)生改變,而且在一些病例中,提出了強(qiáng)有力的證據(jù)支持如下推測(cè):這類改變可能在腫瘤進(jìn)程中起成因作用。目前大約有1,220種已知的人miR。
[0005]癌癥的分類通常依賴于根據(jù)組織學(xué)、細(xì)胞遺傳學(xué)、免疫組織化學(xué)和已知的生物學(xué)行為的腫瘤分型。因此用于腫瘤分類的病理診斷連同癌癥病期一起被用來預(yù)測(cè)預(yù)后和指導(dǎo)治療。然而,癌癥分類和分期的現(xiàn)有方法并不完全可靠。
[0006]肺癌是全球癌癥死亡最常見的原因之一,非小細(xì)胞肺癌(NSCLC)幾乎占這些病例的80%。已報(bào)道了與肺癌的發(fā)生和進(jìn)展有關(guān)的許多遺傳變化,但確切的分子機(jī)制尚不清楚。
[0007]肺腫瘤的分類提出了診斷挑戰(zhàn),并且缺乏用于確定治療方案選擇的分腫瘤亞型的標(biāo)準(zhǔn)化技術(shù)。而且,在約20%的病例中,不可能對(duì)手術(shù)前樣本亞分類(subclassification)。
[0008]對(duì)鱗狀細(xì)胞癌、非鱗狀NSCLC、類癌和小細(xì)胞癌的原發(fā)性肺癌做出正確診斷,尤其對(duì)其做出區(qū)分,對(duì)于治療的選擇具有實(shí)際的重要性。對(duì)于肺癌的精確亞分類,迄今尚無客觀的標(biāo)準(zhǔn)試驗(yàn)。因此,對(duì)于用于區(qū)分特定肺癌的可靠方法,仍存在未被滿足的需求。
[0009]發(fā)明概述
本發(fā)明提供用于各種肺癌亞型的鑒定、分類和診斷的特定核酸序列。本發(fā)明允許在沒有進(jìn)一步操作的情況下根據(jù)肺癌的miR表達(dá)譜對(duì)其進(jìn)行準(zhǔn)確分類。
[0010]利用自200多個(gè)原發(fā)性肺癌的福爾馬林固定石蠟包埋的(FFPE)切除術(shù)樣品(resection sample)、細(xì)針抽吸術(shù)(FM)樣品和細(xì)針活檢(FNB)樣品生成的微RNA微陣列數(shù)據(jù),鑒定對(duì)于各種肺癌亞型顯著不同的微RNA表達(dá)譜。根據(jù)這些研究結(jié)果,開發(fā)出基于微RNA的qRT-PCR測(cè)定法,該測(cè)定法將原發(fā)性肺癌分為以下4種類型:鱗狀細(xì)胞癌、非鱗狀NSCLC、類癌和小細(xì)胞癌。該測(cè)定法可用于切除術(shù)樣本、小的活檢樣品、FNA樣品和來自細(xì)胞學(xué)的細(xì)胞塊(cell blo cks)。
[0011]本發(fā)明還提供用于區(qū)分肺癌的特定亞型的方法,所述方法包括:自受試者獲得生物樣品;測(cè)定所述樣品中的選自以下核酸序列的表達(dá)譜:SEQ ID NO: 1-8、其片段和與之具有至少約80%同一性的序列;并將所述表達(dá)譜與參比表達(dá)譜進(jìn)行比較;其中所述表達(dá)譜與所述參比表達(dá)譜的比較結(jié)果表明所述肺癌。
[0012]按照一些實(shí)施方案,所述肺癌選自鱗狀細(xì)胞癌、非鱗狀NSCLC、肺類癌(carcinoidlung cancer)和小細(xì)胞肺癌。
[0013]按照一個(gè)實(shí)施方案,所述核酸序列選自SEQ ID NO: 3、7、8 ;其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有肺類癌。
[0014]按照另一個(gè)實(shí)施方案,所述核酸序列選自SEQ ID NO: 1、其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有小細(xì)胞肺癌(SCLC)。
[0015]按照一個(gè)實(shí)施方案,所述核酸序列選自SEQ ID NO: 2、5、6 ;其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有非鱗狀非小細(xì)胞肺癌(NSCLC)。
[0016]按照另一個(gè)實(shí)施方案,所述核酸序列選自SEQ ID NO: 4、其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有鱗狀細(xì)胞癌。
[0017]在某些實(shí)施方案中,受試者是人。
[0018]在某些實(shí)施方案中 ,所述方法用來確定受試者的治療進(jìn)程。
[0019]按照一些實(shí)施方案,本發(fā)明的分類方法還包括分類器算法(classifieralgorithm),所述分類器算法選自K最近鄰分類器(KNN)、邏輯斯謫回歸分類器、線性回歸分類器、最近鄰分類器、神經(jīng)網(wǎng)絡(luò)分類器、高斯混合模型(GMM)分類器和支持向量機(jī)(Support Vector Machine, SVM)分類器。分類器可利用決策樹結(jié)構(gòu)(包括二叉樹)或表決(包括加權(quán)表決)方案以比較一個(gè)或多個(gè)模型,所述模型將一個(gè)或多個(gè)類別與其它類別進(jìn)行比較。
[0020]按照一些實(shí)施方案,所述生物樣品選自體液、細(xì)胞系和組織樣品。按照一些實(shí)施方案,所述組織是新鮮的、冷凍的、固定的、蠟包埋的或福爾馬林固定石蠟包埋的(FFPE)組織。按照一個(gè)實(shí)施方案,組織樣品是肺樣品。
[0021]按照一些實(shí)施方案,所述方法包括測(cè)定至少兩個(gè)核酸序列的表達(dá)水平。按照一些實(shí)施方案,所述方法還包括組合一個(gè)或多個(gè)表達(dá)比。按照一些實(shí)施方案,表達(dá)水平通過選自以下的方法測(cè)定:核酸雜交、核酸擴(kuò)增及其組合。按照一些實(shí)施方案,核酸雜交使用固相核酸生物芯片陣列進(jìn)行。按照某些實(shí)施方案,核酸雜交使用原位雜交進(jìn)行。
[0022]按照其它實(shí)施方案,核酸擴(kuò)增方法是實(shí)時(shí)PCR (RT-PCR)。按照一個(gè)實(shí)施方案,所述實(shí)時(shí)PCR是定量實(shí)時(shí)PCR (qRT-PCR)。
[0023]按照一些實(shí)施方案,RT-PCR方法包括正向和反向引物。按照其它實(shí)施方案,正向弓丨物包含選自以下的序列:SEQ ID NO: 9-16的任一個(gè)和與之有至少約80%同一性的序列。按照一些實(shí)施方案,實(shí)時(shí)PCR方法還包括用探針進(jìn)行雜交。按照一些實(shí)施方案,探針包含與選自SEQ ID NO: 1-8的序列互補(bǔ)的核酸序列。
[0024]按照其它實(shí)施方案,探針包含選自以下的序列:SEQ ID NO: 17_24、其片段和與之有至少約80%同一性的序列。[0025]本發(fā)明還提供用于肺癌分類的試劑盒,所述試劑盒包含探針,所述探針包含與選自SEQ ID NO: 1-8的序列、其片段和與之具有至少約80%同一性的序列互補(bǔ)的核酸序列。按照其它實(shí)施方案,探針包含選自SEQ ID NO: 17-24和與之具有至少約80%同一性的序列的核酸序列。
[0026]按照其它實(shí)施方案,試劑盒還包含正向引物,所述引物包含選自SEQ ID NO: 9-16和與之具有至少約80%同一性的序列的序列。
[0027]結(jié)合接下來的附圖、描述和權(quán)利要求書,本發(fā)明的這些和其它實(shí)施方案將是顯然的。
[0028]附圖簡(jiǎn)述
圖1A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa_miR-106a(SEQ ID NO:1)表達(dá)的分布的盒形圖(boxplot presentation):1_肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0029]圖2A-B是比較獲 自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa-miR-125a-5p (SEQ ID NO: 2)的表達(dá)分布的盒形圖:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0030]圖3A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa-miR-129-3p (SEQ ID NO: 3)的表達(dá)分布的盒形圖:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0031]圖4A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa-miR-205 (SEQ ID NO: 4)的表達(dá)分布的盒形圖:1_肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0032]圖5A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa_miR-21(SEQ ID NO: 5)的表達(dá)分布的盒形圖:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。[0033]圖6A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa-miR-29b (SEQ ID NO: 6)的表達(dá)分布的盒形圖:1_肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0034]圖7A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa-miR-375 (SEQ ID NO: 7)的表達(dá)分布的盒形圖:1_肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0035]圖8A-B是比較獲自以下患者的腫瘤樣品(A-FFPE+FNA+FNB,B-FNA)中hsa_miR-7(SEQ ID NO: 8)的表達(dá)分布的盒形圖:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀非小細(xì)胞肺癌(NSCLC)、IV-鱗狀細(xì)胞癌。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。 [0036]圖9是顯示分類結(jié)果的混淆矩陣。各個(gè)樣品使用所有其它樣品進(jìn)行分類。y軸顯示通過病理學(xué)回顧所確定的樣品的類別(“真實(shí)類別”):1_小細(xì)胞肺癌、2-肺類癌、3-非鱗狀NSCLC、4-鱗狀細(xì)胞癌。X軸顯示所得分類。顯示了用于各分類的樣品的數(shù)目一“真實(shí)類另O”對(duì)。矩陣中沒有數(shù)字的項(xiàng)目表明無具有相應(yīng)類別的樣品得到相應(yīng)的分類。總體準(zhǔn)確度為91.7%。小細(xì)胞肺癌的靈敏度為87%,肺類癌為100%,鱗狀細(xì)胞癌為96%,非鱗狀NSCLC為87%。FNA樣品的靈敏度對(duì)于小細(xì)胞肺癌為87%,鱗狀細(xì)胞癌為97%,非鱗狀NSCLC為76%。
[0037]圖10A-F是盒形圖,其比較獲自以下患者:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀NSCLC、IV-鱗狀細(xì)胞癌的FFPE腫瘤樣品中hsa-miR-106a (A, SEQ ID NO:1)和與hsa_miR-106a類似的以下序列的表達(dá)分布:hsa_miR-17 (B, SEQ ID NO: 38)、hsa_miR-20a(C,SEQ ID NO: 39)、hsa-miR-93 (D,SEQ ID NO: 40)、hsa_miR-18a (E,SEQ ID NO: 41)和hsa-miR-18b (F,SEQ ID NO: 42)。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0038]圖1lA-B是盒形圖,其比較獲自以下患者:1-肺類癌、I1-小細(xì)胞肺癌、II1-非鱗狀NSCLC、IV-鱗狀細(xì)胞癌的FFPE腫瘤樣品中hsa-miR-29b (A, SEQ ID NO: 6)和與hsa-miR-29b類似的序列hsa-miR-29c (B, SEQ ID NO: 48)的表達(dá)分布。結(jié)果以實(shí)時(shí)PCR為基礎(chǔ),歸一化信號(hào)越高表明樣品中存在的miR的表達(dá)越高。盒中的線條表明中值。盒頂和盒底邊界表明第25和第75百分位數(shù)。水平線和十字形(離群值,其距盒頂或盒底邊界的距離大于盒高的1.5倍)顯示該組中的完整信號(hào)范圍。
[0039]發(fā)明詳述本發(fā)明部分基于這樣的發(fā)現(xiàn),即特定的核酸序列(SEQ ID NO: 1-8)和與之有關(guān)的核酸分子可用于特定肺癌的鑒定、分類和診斷。
[0040]本發(fā)明提供可用于區(qū)分各種肺癌亞型的靈敏的、特異性的和準(zhǔn)確的方法。
[0041]本發(fā)明的方法具有高的靈敏度和特異性。區(qū)分特定肺癌的可能性便于為患者提供最好的和最適合的治療。
[0042]本發(fā)明提供通過比較本發(fā)明的特定微RNA分子的水平,定量和定性檢測(cè)、診斷、監(jiān)測(cè)、分期和預(yù)測(cè)癌癥的診斷測(cè)定法和方法。該水平優(yōu)選在活檢樣品、腫瘤樣品、細(xì)胞、組織和/或體液的至少一種中測(cè)量,包括正常和異常水平的測(cè)定。本發(fā)明提供通過分析活檢樣品、腫瘤樣品、細(xì)胞、組織或體液中所述微RNA分子水平的變化而診斷特定癌癥的存在情況的方法。
[0043]在本發(fā)明中,測(cè)定活檢樣品、腫瘤樣品、細(xì)胞、組織或體液中所述微RNA水平的存在情況特別可用于區(qū)分不同類型的肺癌。
[0044]本發(fā)明的所有方法可任選包括測(cè)量其它癌癥標(biāo)志物的水平。除所述微RNA分子以外,可用于本發(fā)明的其它癌癥標(biāo)志物將取決于待測(cè)試的癌癥,并且是本領(lǐng)域技術(shù)人員已知的。
[0045]可用于測(cè)定得自患者的樣品中基因表達(dá)(例如本發(fā)明的核酸序列)的水平的測(cè)定技術(shù)為本領(lǐng)域技術(shù)人員所熟知。這類測(cè)定方法包括而不限于放射免疫測(cè)定法、逆轉(zhuǎn)錄酶PCR(RT-PCR)測(cè)定法、免疫組織化學(xué)測(cè)定法、原位雜交測(cè)定法、競(jìng)爭(zhēng)結(jié)合測(cè)定法、RNA印跡分析、ELISA測(cè)定法和生物芯片分析。
[0046]在本發(fā)明的一些實(shí)施方案中,相關(guān)性和/或分級(jí)聚類可用于通過設(shè)置用于將樣品或癌癥樣品指定為兩組之一的任意閾值,來評(píng)價(jià)特定樣品和癌癥樣品的不同樣本之間的本發(fā)明核酸序列的表達(dá)水平的`相似性?;蛘?,用于指定的閾值作為參數(shù)處理,所述參數(shù)可用來量化把樣品指定為各類別的置信度??筛鶕?jù)臨床情況,比例調(diào)節(jié)(scale)用于指定的閾值以利于靈敏度或特異性。與參比數(shù)據(jù)的關(guān)聯(lián)值產(chǎn)生可經(jīng)比例調(diào)節(jié)的連續(xù)評(píng)分。
[0047]定義
在公開和描述本發(fā)明的組合物和方法之前,要了解本文所用術(shù)語僅用于描述具體實(shí)施方案的目的,且并非旨在限制性的。必須注意,說明書和隨附權(quán)利要求書所用的單數(shù)形式“一個(gè)”、“一種”和“所述”包括復(fù)數(shù)對(duì)象,除非上下文中另有明確規(guī)定。
[0048]對(duì)于本文描述的數(shù)字范圍,明確考慮其中具有相同精確度的各個(gè)中間數(shù)。例如,對(duì)于6-9的范圍,除6和9以外還考慮數(shù)值7和8,對(duì)于6.0-7.0的范圍,明確考慮6.0、6.1、
6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9 和 7.0。
[0049]異常增殖
本文所用術(shù)語“異常增殖”意指偏離正常、適當(dāng)或預(yù)期進(jìn)程的細(xì)胞增殖。例如,異常細(xì)胞增殖可包括其DNA或其它細(xì)胞組分已受損或有缺陷的細(xì)胞的不當(dāng)增殖。異常細(xì)胞增殖可包括其特性與這樣的指征相關(guān)的細(xì)胞增殖,所述指征由不當(dāng)?shù)母咚降募?xì)胞分裂、不當(dāng)?shù)牡退降募?xì)胞凋亡或兩者引起或介導(dǎo),或者所述指征導(dǎo)致不當(dāng)?shù)母咚降募?xì)胞分裂、不當(dāng)?shù)牡退降募?xì)胞凋亡或兩者兼有。這類指征可通過例如細(xì)胞、細(xì)胞群或組織的單一或多個(gè)局部異常增生(不論癌性或非癌性、良性或惡性)來表征。
[0050]約本文所用術(shù)語“約”是指+/-10%。
[0051]反義
本文所用術(shù)語“反義”是指與特定DNA或RNA序列互補(bǔ)的核苷酸序列。術(shù)語“反義鏈”用來指與“有義”鏈互補(bǔ)的核酸鏈。反義分子可通過任何方法產(chǎn)生,包括將目標(biāo)基因以反向與允許互補(bǔ)鏈合成的病毒啟動(dòng)子連接的合成。一旦導(dǎo)入細(xì)胞,則該轉(zhuǎn)錄鏈與由細(xì)胞產(chǎn)生的天然序列結(jié)合形成雙鏈體。這些雙鏈體然后阻斷進(jìn)一步轉(zhuǎn)錄或翻譯。用這種方式可產(chǎn)生突變型表型。
[0052]連接的 本文所用“連接的”或“固定化的”是指探針和固相支持體,并可意指探針和固相支持體之間的結(jié)合在結(jié)合、洗滌、分析和除去條件下足夠穩(wěn)定。結(jié)合可以是共價(jià)或非共價(jià)的。共價(jià)鍵可在探針和固相支持體之間直接形成,或可通過交聯(lián)劑或通過在固相支持體或探針或兩者上包括特定反應(yīng)基團(tuán)來形成。非共價(jià)結(jié)合可以是靜電、親水和疏水相互作用的一種或兩種。非共價(jià)結(jié)合所包括的是分子(例如鏈霉抗生物素)與支持體的共價(jià)連接和生物素化探針與鏈霉抗生物素的非共價(jià)結(jié)合。固定還可包括共價(jià)和非共價(jià)相互作用的組合。
[0053]生物樣品
本文所用“生物樣品”意指包含核酸的生物組織或流體的樣品。這類樣品包括但不限于自受試者中分離的組織或流體。生物樣品還可包括組織切片,例如活檢樣品和尸檢樣品、FFPE樣品,采集用于組織學(xué)目的的冷凍切片、血液、血漿、血清、痰、糞便、淚液、粘液、毛發(fā)和皮膚。生物樣品還包括外植塊和來源于動(dòng)物或患者組織的原代和/或轉(zhuǎn)化細(xì)胞培養(yǎng)物。
[0054]生物樣品還可為血液、血液級(jí)分、尿液、滲出物、腹水、唾液、腦脊液、宮頸分泌物、陰道分泌物、子宮內(nèi)膜分泌物、胃腸分泌物、支氣管分泌物、痰、細(xì)胞系、組織樣品、細(xì)針抽吸術(shù)(FNA)的細(xì)胞內(nèi)容物或乳房分泌物。還可通過從動(dòng)物中移出細(xì)胞樣品來提供生物樣品,但也可通過使用之前分離的細(xì)胞(例如由其它人、在其它時(shí)間和/或出于其它目的分離的細(xì)胞),或通過體內(nèi)進(jìn)行本文所述方法來實(shí)現(xiàn)。還可以使用歸檔組織(archival tissues),例如具有治療或結(jié)果記載的組織。
[0055]癌癥
術(shù)語“癌癥”意在包括不考慮組織病理學(xué)類型或侵襲階段的癌性生長(zhǎng)或致癌性過程、轉(zhuǎn)移性組織或惡性轉(zhuǎn)化的細(xì)胞、組織或器官的所有類型。癌癥的實(shí)例包括但不限于實(shí)體瘤和白血病,包括:胺前體攝取脫羧細(xì)胞瘤(apudoma)、迷芽瘤、鰓原瘤、惡性類癌綜合征、類癌性心臟病、癌(例如Walker癌、基底細(xì)胞癌、基底鱗狀細(xì)胞癌、Brown-Pearce癌、導(dǎo)管癌、Ehrlich瘤、神經(jīng)內(nèi)分泌肺癌(例如小細(xì)胞肺癌(SCLC)、大細(xì)胞神經(jīng)內(nèi)分泌癌(LCNEC)、典型類癌(TC)神經(jīng)內(nèi)分泌腫瘤和非典型類癌(AC)神經(jīng)內(nèi)分泌腫瘤)、非小細(xì)胞肺癌(例如肺鱗狀細(xì)胞癌、肺腺癌和肺未分化大細(xì)胞癌)、燕麥細(xì)胞癌、乳頭狀癌、細(xì)支氣管癌、支氣管癌、鱗狀細(xì)胞癌和移行細(xì)胞癌)、組織細(xì)胞病癥、白血病(例如B細(xì)胞白血病、混合細(xì)胞白血病、裸細(xì)胞白血病、T細(xì)胞白血病、慢性T細(xì)胞白血病、HTLV-1I相關(guān)白血病、急性淋巴細(xì)胞白血病、慢性淋巴細(xì)胞白血病、肥大細(xì)胞白血病和髓細(xì)胞性白血病)、惡性組織細(xì)胞增多病、霍奇金病(Hodgkin disease)、免疫增生性小(immunoproliferative small)、非霍奇金淋巴瘤、漿細(xì)胞瘤、網(wǎng)狀內(nèi)皮組織增殖、黑素瘤、成軟骨細(xì)胞瘤、軟骨瘤、軟骨肉瘤、纖維瘤、纖維肉瘤、巨細(xì)胞瘤、組織細(xì)胞瘤、脂肪瘤、脂肉瘤、間皮瘤、粘液瘤、粘液肉瘤、骨瘤、骨肉瘤、尤因肉瘤、滑膜瘤、腺纖維瘤、腺淋巴瘤、癌肉瘤、脊索瘤、顱咽管瘤、無性細(xì)胞瘤、錯(cuò)構(gòu)瘤、間充質(zhì)瘤、中腎瘤、肌肉瘤、成釉細(xì)胞瘤、牙骨質(zhì)瘤、牙瘤、畸胎瘤、胸腺瘤、滋養(yǎng)葉瘤(trophoblastic tumor)、腺癌、腺瘤、膽管瘤、膽脂瘤、圓柱瘤、囊腺癌、囊腺瘤、粒層細(xì)胞瘤、兩性胚細(xì)胞瘤、肝細(xì)胞瘤、汗腺腺瘤、胰島細(xì)胞瘤、睪丸間質(zhì)細(xì)胞瘤、乳頭狀瘤、睪丸支持細(xì)胞瘤、卵泡膜細(xì)胞瘤、平滑肌瘤、平滑肌肉瘤、成肌細(xì)胞瘤、肌肉瘤、橫紋肌瘤、橫紋肌肉瘤、室管膜瘤、神經(jīng)節(jié)瘤、神經(jīng)膠質(zhì)瘤、成神經(jīng)管細(xì)胞瘤、腦脊膜瘤、神經(jīng)鞘瘤、成神經(jīng)細(xì)胞瘤、神經(jīng)上皮瘤、成神經(jīng)細(xì)胞瘤、神經(jīng)瘤、副神經(jīng)節(jié)瘤、非嗜鉻性副神經(jīng)節(jié)瘤、血管角質(zhì)瘤、血管淋巴樣增生伴嗜酸細(xì)胞增多、硬化性血管瘤、血管瘤病、血管球瘤、血管內(nèi)皮瘤、血管瘤、血管外皮細(xì)胞瘤、血管肉瘤、淋巴管瘤、淋巴管肌瘤、淋巴管肉瘤、松果體瘤、癌肉瘤、軟骨肉瘤、葉狀囊性肉瘤、纖維肉瘤、血管肉瘤、平滑肌肉瘤(Ieimyosarcoma)、白血病性肉瘤、月旨肉瘤、淋巴管肉瘤、肌肉瘤、粘液肉瘤、卵巢癌、橫紋肌肉瘤、肉瘤(例如尤因肉瘤、實(shí)驗(yàn)性肉瘤、卡波西肉瘤和肥大細(xì)胞肉瘤)、神經(jīng)纖維瘤病和宮頸發(fā)育異常以及其中細(xì)胞變成永生化或轉(zhuǎn)化的其它病況。
[0056]分類
本文所用“分類”是指其中根據(jù)各項(xiàng)目(稱為性狀、變量、性質(zhì)、特征等)中一個(gè)或多個(gè)內(nèi)在特性的定量信息并根據(jù)統(tǒng)計(jì)模型和/或在先標(biāo)記項(xiàng)目的訓(xùn)練集,將各個(gè)項(xiàng)目分到各組或各類的程序和/或算法。按照一個(gè)實(shí)施方案,分類意指確定肺癌的類型。
[0057]互補(bǔ)
本文所用“互補(bǔ)”或“互補(bǔ)的”意指核酸分子的核苷酸或核苷酸類似物間的沃森-克里克堿基配對(duì)(例如A-T/U和C-G)或Hoogsteen堿基配對(duì)。完全互補(bǔ)或完全互補(bǔ)的可意指核酸分子的核苷酸或核苷酸類似物間的100%互補(bǔ)堿基配對(duì)。
[0058]Ct
Ct信號(hào)表示第一個(gè)PCR循環(huán),其中擴(kuò)增穿過熒光閾值(循環(huán)閾值)。因此,低的Ct值表示高的微RNA豐度或表達(dá)水平。
[0059]在一些實(shí)施方案中,使PCR Ct信號(hào)標(biāo)準(zhǔn)化,使得標(biāo)準(zhǔn)化Ct保持為表達(dá)水平的倒數(shù)。在其它實(shí)施方案中,可將PCR Ct信號(hào)標(biāo)準(zhǔn)化,然后成倒數(shù),使得低的標(biāo)準(zhǔn)化倒數(shù)Ct表示低的微RNA豐度或表達(dá)水平。
[0060]檢測(cè)
“檢測(cè)”意指檢測(cè)樣品中組分的存在情況。檢測(cè)還意指檢測(cè)組分的不存在情況。檢測(cè)還意指定量或定性測(cè)量組分的水平。
[0061]差異表達(dá)
“差異表達(dá)”意指細(xì)胞和組織內(nèi)及細(xì)胞和組織間時(shí)序基因和/或細(xì)胞基因表達(dá)模式的定性或定量差異。因此,差異性表達(dá)的基因可在性質(zhì)上改變其表達(dá),包括例如正常組織相對(duì)于疾病組織中的活化或失活。可使基因在特定狀態(tài)下相對(duì)于另一狀態(tài)打開或關(guān)閉,因此允許比較兩個(gè)或更多個(gè)狀態(tài)。定性調(diào)節(jié)的基因可在某一狀態(tài)或細(xì)胞類型中顯示可通過標(biāo)準(zhǔn)技術(shù)檢測(cè)的表達(dá)模式。一些基因可在一種狀態(tài)或細(xì)胞類型中表達(dá),但不能在兩種狀態(tài)或細(xì)胞類型中表達(dá)?;蛘撸磉_(dá)的差異可以是定量的,例如其中表達(dá)受到調(diào)節(jié),或增量調(diào)節(jié)(導(dǎo)致轉(zhuǎn)錄物的量增加),或減量調(diào)節(jié)(導(dǎo)致轉(zhuǎn)錄物的量降低)。表達(dá)的差異程度只需大到足以通過諸如表達(dá)陣列、定量逆轉(zhuǎn)錄酶PCR、RNA印跡分析(northern analysis)、實(shí)時(shí)PCR、原位雜交和RNA酶保護(hù)等標(biāo)準(zhǔn)表征技術(shù)進(jìn)行量化即可。
[0062]表達(dá)譜
術(shù)語“表達(dá)譜”在廣義上使用以包括基因組表達(dá)譜,例如微RNA的表達(dá)譜。譜可通過用于測(cè)定核酸序列水平的任何合宜方法例如微RNA、標(biāo)記的微RNA、擴(kuò)增的微RNA、cRNA等的定量雜交、定量PCR、用于定量的ELISA等來產(chǎn)生,并且可供分析兩個(gè)樣品間的差異基因表達(dá)。對(duì)受試者或患者腫瘤樣品(例如細(xì)胞或其集合體(例如組織))進(jìn)行測(cè)定。通過本領(lǐng)域已知的任何合宜方法收集樣品。目標(biāo)核酸序列是發(fā)現(xiàn)具有預(yù)測(cè)性的核酸序列,包括上文提供的核酸序列,其中表達(dá)譜可包括2、5、10、20、25、50、100個(gè)或更多個(gè)(包括所有)所列核酸序列的表達(dá)數(shù)據(jù)。按照一些實(shí)施方案,術(shù)語“表達(dá)譜”意指測(cè)量所測(cè)樣品中的核酸序列的豐度或表達(dá)。
[0063]表達(dá)比
本文所用“表達(dá)比”是指通過檢測(cè)生物樣品中相應(yīng)核酸的相對(duì)表達(dá)水平而確定的兩種或更多種核酸的相對(duì)表達(dá)水平。
[0064]FDR 當(dāng)進(jìn)行多重統(tǒng)計(jì)檢驗(yàn)時(shí),例如在比較多個(gè)數(shù)據(jù)特征的兩組間的信號(hào)時(shí),由于可達(dá)到在另外情況下可視為統(tǒng)計(jì)顯著性的水平的組間隨機(jī)差,獲得假陽性結(jié)果的概率越來越高。為了限制這類錯(cuò)誤發(fā)現(xiàn)的比例,統(tǒng)計(jì)顯著性定義為僅用于其中差異達(dá)到閾值以下P值(雙側(cè)t檢驗(yàn))的數(shù)據(jù)特征,其有賴于所進(jìn)行的檢驗(yàn)數(shù)目和這些檢驗(yàn)中所獲得的P值的分布。
[0065]片段
“片段”在本文中用來表示核酸或多肽的非全長(zhǎng)部分。因此,片段本身也分別是核酸或多肽。
[0066]基因
本文所用“基因”可以是天然基因(例如基因組)或合成基因,其包含轉(zhuǎn)錄和/或翻譯調(diào)節(jié)序列和/或編碼區(qū)和/或非翻譯序列(例如內(nèi)含子、5’和3’非翻譯序列)?;虻木幋a區(qū)可以是編碼氨基酸序列或功能性RNA例如tRNA、rRNA、催化性RNA、siRNA、miRNA或反義RNA的核苷酸序列?;蜻€可以是相當(dāng)于編碼區(qū)(例如外顯子和miRNA)的mRNA或cDNA,任選包含與之連接的5’或3’非翻譯序列?;蜻€可以是包含全部或部分編碼區(qū)和/或與之連接的5’或3’非翻譯序列的體外產(chǎn)生的擴(kuò)增核酸分子。
[0067]溝結(jié)合物/小溝結(jié)合物(MGB)
“溝結(jié)合物”和/或“小溝結(jié)合物”可互換使用,是指通常以序列特異性方式適應(yīng)雙鏈DNA的小溝的小分子。小溝結(jié)合物可以是長(zhǎng)的扁平分子,可呈新月形,因此緊貼地適應(yīng)雙螺旋的小溝,常常置換水。小溝結(jié)合分子通常可包含幾個(gè)通過具有扭轉(zhuǎn)自由度的鍵連接的芳族環(huán)例如呋喃、苯或吡咯環(huán)。小溝結(jié)合物可以是抗生素,例如紡錘菌素、偏端霉素、重氮氨苯脒乙酰甘氨酸鹽、噴他脒和其它芳族二脒、Hoechst 33258、SN 6999、金霉酸抗腫瘤藥物例如色霉素和光神霉素、CC-1065、二氫環(huán)吡咯并吲哚(dihydrocyclopyrro1indole)三肽(DPI3)、1,2_ 二氫-(3H)-吡咯并[3, 2_e] 口引哚-7-甲酸酯(1,2-dihydro-(3H)-pyrrolo [3,2_e] indole-7-carboxylate, CDPI3)及相關(guān)化合物和類似物,包括 Nucleic Acids in Chemistry and Biology,第 2 版,Blackburn 和 Gait主編,Oxford University Press,1996和PCT公布申請(qǐng)?zhí)朩O 03/078450中描述的那些,所述文獻(xiàn)的內(nèi)容通過引用結(jié)合到本文中。小溝結(jié)合物可以是引物、探針、雜交標(biāo)簽互補(bǔ)序列的組分或其組合。小溝結(jié)合物可提高它們與之連接的引物或探針的Tm,允許這類引物或探針在較高溫度下有效地雜交。
[0068]宿主細(xì)胞
本文所用“宿主細(xì)胞”可以是天然存在的細(xì)胞或可含有載體并可支持載體復(fù)制的轉(zhuǎn)化細(xì)胞。宿主細(xì)胞可以是培養(yǎng)的細(xì)胞、外植體、體內(nèi)細(xì)胞等。宿主細(xì)胞可以是原核細(xì)胞例如大腸桿菌iE.coll)或真核細(xì)胞例如酵母、昆蟲、兩棲動(dòng)物或哺乳動(dòng)物細(xì)胞,例如CHO和HeLa。
[0069]同一性
本文在兩個(gè)或更多個(gè)核酸或多肽序列的情況下所用“同一性的”或“同一性”意指在特定區(qū)域內(nèi)具有特定百分比的相同殘基的序列。百分比可如下計(jì)算,對(duì)兩個(gè)序列進(jìn)行最佳比對(duì),比較特定區(qū)域內(nèi)的兩個(gè)序列,確定在兩個(gè)序列中出現(xiàn)相同殘基的位置數(shù)以得到匹配位置數(shù),將匹配位置數(shù)除以該特定區(qū)域中的位置總數(shù),將結(jié)果乘以100,得到序列同一性的百分比。在其中兩個(gè)序列具有不同長(zhǎng)度或比對(duì)產(chǎn)生一個(gè)或多個(gè)交錯(cuò)末端以及比較的特定區(qū)域只包括單個(gè)序列的情況下,單一序列的殘基包括在計(jì)算的分母中,但不包括在分子中。當(dāng)比較DNA和RNA時(shí),胸腺嘧啶(T)和尿嘧啶(U)可視為等同物。同一性可手工進(jìn)行或通過應(yīng)用計(jì)算機(jī)序列算法例如BLAST或BLAST 2.0進(jìn)行。
[0070]原位檢測(cè)
本文所用“原位檢測(cè)”意指在原始位置處因此意指在組織樣品(例如活組織檢查)中檢測(cè)表達(dá)或表達(dá)水平。
[0071]K最近鄰
短語“K最近鄰”是指通`過計(jì)算點(diǎn)與訓(xùn)練數(shù)據(jù)集中各點(diǎn)間的距離來對(duì)該點(diǎn)進(jìn)行分類的分類方法。然后將該點(diǎn)指派到在其K最近鄰(其中K為整數(shù))間最常見的類別中。
[0072]標(biāo)記
本文所用“標(biāo)記”意指通過分光鏡、光化學(xué)、生物化學(xué)、免疫化學(xué)、化學(xué)或其它物理手段可檢測(cè)的組合物(composition)。例如有用的標(biāo)記包括32P、熒光染料、電子致密試劑、酶(例如常用于ELISA的酶)、生物素、洋地黃毒苷(digoxigenin)或半抗原和可使其可檢測(cè)的其它實(shí)體??蓪?biāo)記在任何位置處摻入核酸和蛋白質(zhì)中。
[0073]邏輯斯謫回歸
邏輯斯謫回歸是稱為廣義線性模型的統(tǒng)計(jì)模型范疇的部分。邏輯斯謫回歸允許從一組可以是連續(xù)的、離散的、二分的或任何這些的混合的變量預(yù)測(cè)離散結(jié)果,例如組成員。因變量或反應(yīng)變量是二分的,例如兩種可能的癌癥類型之一。邏輯斯謫回歸將優(yōu)勢(shì)比(即屬于第一組的概率(?相對(duì)于屬于第二組的概率U -P)的比率)的自然對(duì)數(shù)模型化,作為不同表達(dá)水平(以對(duì)數(shù)空間(log-space)表示)和其它解釋變量的線性組合。邏輯斯謫回歸輸出可通過規(guī)定如果/7大于0.5或50%,則病例或樣品可歸類為第一類型而用作分類器。或者,計(jì)算的概率P在其它情況下(例如ID或2D閾值分類器)可用作變量。
[0074]1D/2D閾值分類器
本文所用“1D/2D閾值分類器”可意指用于將病例或樣品(例如癌癥樣品)分成兩種可能類型例如兩種癌癥類型或兩種預(yù)后類型(例如良好和差)之一的算法。對(duì)于ID閾值分類器,判定基于一個(gè)變量和一個(gè)預(yù)定的閾值;如果變量超過閾值,則將樣品指定為一類,如果變量小于閾值,則指定為另一類。2D閾值分類器是根據(jù)兩個(gè)變量的值歸類為兩種類型之一的算法??捎?jì)算評(píng)分為兩個(gè)變量的函數(shù)(通常為連續(xù)函數(shù));然后,與ID閾值分類器相似,通過將評(píng)分與預(yù)定閾值進(jìn)行比較來做出判定。
[0075]核酸
本文所用“核酸”或“寡核苷酸”或“多核苷酸”意指至少兩個(gè)核苷酸共價(jià)連接在一起。單鏈的描述還限定了互補(bǔ)鏈的序列。因此,核酸還包括所述單鏈的互補(bǔ)鏈。核酸的許多變體可用于與規(guī)定核酸相同的目的。因此,核酸還包括基本相同的核酸及其互補(bǔ)序列。單鏈提供可在嚴(yán)格雜交條件下與靶序列雜交的探針。因此,核酸還包括在嚴(yán)格雜交條件下雜交的探針。
[0076]核酸可以是單鏈的或雙鏈的,或可含有雙鏈和單鏈序列兩者的部分。核酸可以是DNA (基因組DNA和cDNA兩者)、RNA或雜合體,其中核酸可含有脫氧核糖核苷酸和核糖核苷酸的組合以及包括以下堿基的組合:尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤、肌苷、黃嘌呤、次黃嘌呤、異胞嘧啶和異鳥嘌呤。核酸可通過化學(xué)合成方法或通過重組方法獲得。
[0077]核酸一般可含有磷酸二酯鍵,雖然可包括可具有至少一個(gè)不同鍵的核酸類似物,例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基氨基磷酸酯(methylphosphoroamidite)鍵和肽核酸骨架和鍵。其它類似的核酸包括具有正性骨架、非離子骨架和非核糖骨架的核酸,包括美國專利號(hào)5,235,033和5,034,506中描述的核酸,所述專利通過引用予以結(jié)合。含有一個(gè)或多個(gè)非天然存在的或修飾核苷酸的核酸也包括在核酸的一個(gè)定義中。修 飾核苷酸類似物可位于例如核酸分子的5’端和/或3’端。核苷酸類似物的代表性實(shí)例可選自糖修飾的核糖核苷酸和骨架修飾的核糖核苷酸。然而,應(yīng)當(dāng)注意,核堿修飾的核糖核苷酸,即含有非天然存在的核堿而不是天然存在的核堿的核糖核苷酸也是適宜的,所述非天然存在的核堿例如在5位修飾的尿苷或胞苷,例如5-(2-氨基)丙基尿苷、5-溴尿苷;在8位修飾的腺苷和鳥苷,例如8-溴鳥苷;脫氮核苷酸,例如7-脫氮-腺苷;0_烷基化核苷酸和N-烷基化核苷酸,例如N6-甲基腺苷。2’ -OH基團(tuán)可被選自以下的基團(tuán)置換:H、OR、R、鹵素、SH、SR、NH2, NHR、NR2或CN,其中R為C1-C6烷基、烯基或炔基,鹵素為F、Cl、Br或I。修飾核苷酸還包括通過例如以下文獻(xiàn)中描述的輕脯氨醇鍵(hydroxyproIinoI linkage)與膽固醇綴合的核苷酸:Krutzfeldt等,Nature 438:685-689(2005)和Soutschek等,Nature 432:173-178 (2004),其通過引用結(jié)合到本文中。可出于多種原因?qū)怂?磷酸骨架進(jìn)行修飾,例如提高這類分子在生理環(huán)境的穩(wěn)定性和半衰期、促進(jìn)跨細(xì)胞膜的擴(kuò)散或作為生物芯片上的探針。骨架修飾還可提高對(duì)降解的抗性,例如在細(xì)胞的嚴(yán)酷胞吞環(huán)境中。骨架修飾還可降低經(jīng)由例如肝中的肝細(xì)胞的核酸清除??芍苽涮烊淮嬖诘暮怂岷皖愃莆锏幕旌衔?;或者,可制備不同核酸類似物的混合物和天然存在的核酸和類似物的混合物。
[0078]探針
本文所用“探針”意指能夠通過一種或多種化學(xué)鍵類型、通常通過互補(bǔ)堿基配對(duì)、通常通過氫鍵形成而與互補(bǔ)序列的靶核酸結(jié)合的寡核苷酸。根據(jù)雜交條件的嚴(yán)格性,探針可結(jié)合與探針序列缺乏完全互補(bǔ)性的靶序列??赡艽嬖谌魏螖?shù)目的堿基對(duì)錯(cuò)配,所述錯(cuò)配干擾本文述靶序列和單鏈核酸間的雜交。然而,如果突變數(shù)如此大以致于甚至在最小嚴(yán)格雜交條件下都不能發(fā)生雜交,則該序列不是互補(bǔ)靶序列。探針可為單鏈或部分單鏈和部分雙鏈。探針的鏈性受靶序列的結(jié)構(gòu)、組成和性質(zhì)支配。探針可被直接標(biāo)記或間接標(biāo)記,例如用生物素標(biāo)記,鏈霉抗生物素復(fù)合物可稍后與之鍵合。
[0079]啟動(dòng)子
本文所用“啟動(dòng)子”意指能夠在細(xì)胞中提供、激活或提高核酸表達(dá)的合成或天然衍生的分子。啟動(dòng)子可包含進(jìn)一步提高所述核酸表達(dá)和/或改變所述核酸的空間表達(dá)和/或時(shí)間表達(dá)的一個(gè)或多個(gè)特異性轉(zhuǎn)錄調(diào)節(jié)序列。啟動(dòng)子還可包含遠(yuǎn)端增強(qiáng)子或阻抑元件,其可位于距轉(zhuǎn)錄起始位點(diǎn)多達(dá)幾千堿基對(duì)。啟動(dòng)子可來源于以下來源,包括病毒、細(xì)菌、真菌、植物、昆蟲和動(dòng)物。啟動(dòng)子可組成型或相對(duì)于其中發(fā)生表達(dá)的細(xì)胞、組織或器官,或相對(duì)于發(fā)生表達(dá)的發(fā)育階段,或因響應(yīng)外部刺激(例如生理應(yīng)激、病原體、金屬離子或誘導(dǎo)劑)而差異性調(diào)芐基因組分的表達(dá)。
[0080]啟動(dòng)子的代表性實(shí)例包括噬菌體T7啟動(dòng)子、噬菌體T3啟動(dòng)子、SP6啟動(dòng)子、Iac操縱基因-啟動(dòng)子、tac啟動(dòng)子、SV40晚期啟動(dòng)子、SV40早期啟動(dòng)子、RSV-LTR啟動(dòng)子、CMV IE啟動(dòng)子、SV40早期啟動(dòng)子或SV40晚期啟動(dòng)子和CMV IE啟動(dòng)子。
[0081]參比表達(dá)譜
本文所用術(shù)語“參比表達(dá)譜”意指當(dāng)與測(cè)定結(jié)果比較時(shí)與特定結(jié)果在統(tǒng)計(jì)上相關(guān)聯(lián)的值。在優(yōu)選的實(shí)施方案中,根據(jù)比較微RNA表達(dá)與已知臨床結(jié)果的研究的統(tǒng)計(jì)分析來確定參比值。參比值可以是閾值評(píng)分值或截止評(píng)分值。通常參比值可為閾值,高于該值一種結(jié)果更有可能,低于該值替代閾值更有可能。
[0082]選擇標(biāo)記
本文所用“選擇標(biāo)記”意指賦予宿主細(xì)胞表型的任何基因,選擇標(biāo)記在細(xì)胞中表達(dá)以利于被遺傳構(gòu)建體轉(zhuǎn)染或轉(zhuǎn)化的細(xì)胞的鑒定和/或選擇。選擇標(biāo)記的代表性實(shí)例包括氨芐西林抗性基因(Amp1O、四環(huán)素抗性基因(IV)、細(xì)菌卡那霉素抗性基因(KarO、零霉素(zeocin)抗性基因、賦予抗生素金擔(dān)子素A抗性的AUR1-C基因、膦絲菌素(phosphinothricin)抗性基因、新霉素磷酸轉(zhuǎn)移酶基因(nptll)、潮霉素抗性基因、β-葡糖醛酸糖苷酶(GUS)基因、氯霉素乙酰轉(zhuǎn)移酶(CAT)基因、綠色熒光蛋白(GFP)-編碼基因和螢光素酶基因。
[0083]靈敏度
本文所用“靈敏度”可意指二元分類檢驗(yàn)正確鑒定病況的程度如何的統(tǒng)計(jì)學(xué)度量,例如將癌癥正確歸類為兩種可能類型中的正確類型的頻繁程度。A類的靈敏度是通過檢驗(yàn)確定屬于“A”類的病例占為“A”類的病例(如通過某一絕對(duì)標(biāo)準(zhǔn)或金標(biāo)準(zhǔn)確定)的比例。
[0084]特異性
本文所用“特異性”可意指二元分類檢驗(yàn)正確鑒定病況的程度如何的統(tǒng)計(jì)學(xué)度量,例如將癌癥正確歸類為兩種可能類型中的正確類型的頻繁程度。A類的特異性是通過檢驗(yàn)確定屬于“非A”類的病例占為“非A”類的病例(如通過某一絕對(duì)標(biāo)準(zhǔn)或金標(biāo)準(zhǔn)確定的)的比例。
[0085]嚴(yán)格雜交條件
本文所用“嚴(yán)格雜交條件”意指這樣的條件,在此條件下第一核酸序列(例如,探針)例如在核酸的復(fù)雜混合物中可與第二核酸序列(例如,靶)雜交。嚴(yán)格條件是序列依賴性的,并且在不同環(huán)境下將不同。對(duì)于特定序列,在規(guī)定的離子強(qiáng)度、pH下,可選擇低于熱熔點(diǎn)(Tm)約5-10°C的嚴(yán)格條件。Tm可以是這樣的溫度(在規(guī)定的離子強(qiáng)度、pH和核酸濃度下),在該溫度下50%與靶互補(bǔ)的探針在平衡時(shí)與靶序列雜交(因?yàn)榘行蛄羞^量存在,所以Tm下,50%的探針在平衡時(shí)被占據(jù))。
[0086]嚴(yán)格條件可以是這樣的條件,其中在pH 7.0-8.3下鹽濃度小于約1.0 M鈉離子,例如約0.01-1.0 M鈉離子濃度(或其它鹽),且溫度對(duì)于短探針(例如,約10-50個(gè)核苷酸)為至少約30°C,對(duì)于長(zhǎng)探針(例如,大于約50個(gè)核苷酸)為至少約60°C。嚴(yán)格條件還可在加入去穩(wěn)定劑(例如甲酰胺)的情況下實(shí)現(xiàn)。對(duì)于選擇性或特異性雜交,陽性信號(hào)可為背景雜交的至少2-10倍。示例性的嚴(yán)格雜交條件包括以下條件:50%甲酰胺、5x SSC和1% SDS,在 42°C下溫育,或 5x SSC、1% SDS,在 65°C下溫育,并在 65°C下在 0.2x SSC 和 0.1%SDS中洗滌。
[0087]基本互補(bǔ)
本文所用“基本互補(bǔ)”意指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100 個(gè)或更多個(gè)核苷酸的范圍內(nèi),第一序列與第二序列的互補(bǔ)序列有至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%同一性,或者兩個(gè)序列在嚴(yán)格雜交條件下雜交。
[0088]基本相同的
本文所用“基本相同的”意指在 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100 個(gè)或更多個(gè)核苷酸或氨基酸的范圍內(nèi),第一序列和 第二序列有至少 60%、65%、70%、75%、80%、85%、90%、95%、97%、98% 或 99%同一性,或者就核酸而言,如果第一序列與第二序列的互補(bǔ)序列基本上互補(bǔ)。
[0089]受試者
本文所用術(shù)語“受試者”是指哺乳動(dòng)物,包括人和其它哺乳動(dòng)物兩種。本發(fā)明的方法優(yōu)選應(yīng)用于人類受試者。
[0090]靶核酸
本文所用“靶核酸”意指可被另一個(gè)核酸結(jié)合的核酸或其變體。靶核酸可以是DNA序列。靶核酸可以是RNA。靶核酸可包含mRNA、tRNA、shRNA、siRNA或Piwi相互作用RNA,或pr1-miRNA、pre-miRNA> miRNA 或反-miRNA (ant1-miRNA)。
[0091]靶核酸可包含靶miRNA結(jié)合部位或其變體。一個(gè)或多個(gè)探針可結(jié)合靶核酸。靶結(jié)合部位可包含5-100或10-60個(gè)核苷酸。靶結(jié)合部位可包含共5、6、7、8、9、10、11、12、13、14、
15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30-40、40-50、50-60、61、62 或 63 個(gè)核苷酸。革巴位點(diǎn)序列可包含公開于美國專利申請(qǐng)?zhí)?1/384,049、11/418,870或11/429,720的革巴miRNA結(jié)合部位的序列的至少5個(gè)核苷酸,所述專利申請(qǐng)的內(nèi)容結(jié)合于本文中。
[0092]閾值表達(dá)水平
本文所用短語“閾值表達(dá)水平”是指將測(cè)量值與之比較以確定肺癌的特定類型的標(biāo)準(zhǔn)表達(dá)值。參比表達(dá)譜可基于核酸的表達(dá)水平,或者可基于其綜合的度量評(píng)分。
[0093]組織樣品
本文所用組織樣品是采用相關(guān)醫(yī)學(xué)領(lǐng)域普通技術(shù)人員熟知的方法獲自活組織檢查的組織。本文所用短語“疑似癌性”意指醫(yī)學(xué)領(lǐng)域普通技術(shù)人員認(rèn)為含有癌細(xì)胞的癌組織樣品。從活組織檢查獲得樣品的方法包括團(tuán)塊(mass)的大致分配(gross apportioning)、顯微切割、基于激光的顯微切割或其它本領(lǐng)域已知的細(xì)胞分離方法。
[0094]變體
本文所用的涉及核酸的“變體”意指⑴參考核苷酸序列的一部分;(ii)參考核苷酸序列或其部分的互補(bǔ)序列;(iii)與參考核酸或其互補(bǔ)序列基本相同的核酸;或(iv)與參考核酸、其互補(bǔ)序列或與之基本相同的序列在嚴(yán)格條件下雜交的核酸。
[0095]載體
本文所用“載體”意指含有復(fù)制起點(diǎn)的核酸序列。載體可以是質(zhì)粒、噬菌體、細(xì)菌人工染色體或酵母人工染色體。載體可以是DNA或RNA載體。載體可以是自我復(fù)制的染色體外載體或整合至宿主基因組的載體。 [0096]野生型
本文所用術(shù)語“野生型”序列是指編碼序列、非編碼序列或連接序列(interfacesequence),所述連接序列是執(zhí)行該序列的天然或正常功能的序列的等位基因形式。野生型序列包括同族序列(cognate sequence)的復(fù)等位基因形式,例如野生型序列的復(fù)等位基因可編碼一個(gè)編碼序列編碼的蛋白質(zhì)序列的沉默變化或保守變化。
[0097]本發(fā)明將miRNA應(yīng)用于特定肺癌的鑒定、分類和診斷。
[0098]微RNA加工
編碼微RNA (miRNA)的基因可轉(zhuǎn)錄,導(dǎo)致miRNA前體(稱為pr1-miRNA)的產(chǎn)生。pr1-miRNA可以是包含多個(gè)pr1-miRNA的多順反子RNA的部分。pr1-miRNA可形成帶有莖和環(huán)的發(fā)夾結(jié)構(gòu)。莖可包含錯(cuò)配堿基。
[0099]PriniRNA的發(fā)夾結(jié)構(gòu)可被Drosha (其是一種RNase III內(nèi)切核酸酶)識(shí)別。Drosha可識(shí)別pr1-miRNA中的末端環(huán),并切割約2個(gè)螺旋轉(zhuǎn)角到莖中以產(chǎn)生60-70個(gè)核苷酸前體,稱為pre-miRNA。Drosha可以RNase III內(nèi)切核酸酶特有的交錯(cuò)切口,切割pr1-miRNA,產(chǎn)生具有5’磷酸和約2個(gè)核苷酸3’突出端的pre-miRNA莖環(huán)。延伸至Drosha切割位點(diǎn)以外的莖(約10個(gè)核苷酸)的約I個(gè)螺旋轉(zhuǎn)角對(duì)有效加工可能是必需的。然后可通過Ran-GTP和輸出受體Ex-portin-5主動(dòng)地將pre_miRNA從核轉(zhuǎn)運(yùn)至胞質(zhì)。
[0100]pre-miRNA可被Dicer (其也是一種RNase III內(nèi)切核酸酶)識(shí)別。Dicer可識(shí)別pre-miRNA的雙鏈莖。Dicer還可識(shí)別莖環(huán)基部的5’磷酸和3’突出端。Dicer可從莖環(huán)基部切下末端環(huán)2個(gè)螺旋轉(zhuǎn)角,留下另外的5’磷酸和約2個(gè)核苷酸3’突出端。所得的可包含錯(cuò)配的siRNA樣雙鏈體包含成熟miRNA和相似大小的稱為miRNA*的片段。miRNA和miRNA*可來源于pr1-miRNA和pre-miRNA的相對(duì)臂。MiRNA*序列可存在于克隆miRNA文庫,但通常頻率比miRNA低。
[0101]雖然最初作為具有miRNA*的雙鏈種類存在,但miRNA最終可作為單鏈RNA摻入到核糖核蛋白復(fù)合體(稱為RNA誘導(dǎo)沉默復(fù)合體(RISC))中。各種蛋白質(zhì)都可形成RISC,這可導(dǎo)致以下方面的變化性:對(duì)miRNA/miRNA*雙鏈體的特異性、靶基因的結(jié)合部位、miRNA的活性(阻抑或活化)、miRNA/miRNA*雙鏈體的哪條鏈加載入RISC中。
[0102]當(dāng)miRNA:miRNA*雙鏈體的miRNA鏈加載入RISC時(shí),miRNA*可被除去并降解。加載至RISC的miRNA:miRNA*雙鏈體的鏈可以是其5’端較不緊密配對(duì)的鏈。在miRNA:miRNA*的兩端具有大致相當(dāng)?shù)?’配對(duì)的情況下,miRNA和miRNA*兩者可具有基因沉默活性。
[0103]RISC可根據(jù)miRNA和mRNA之間高水平的互補(bǔ)性,尤其通過miRNA的核苷酸2_7來鑒定靶核酸。在動(dòng)物中只報(bào)告了一例,其中miRNA及其靶之間的相互作用沿著miRNA的全長(zhǎng)。對(duì)于mir-196和Hox B8表明如此,并且進(jìn)一步表明mir_196介導(dǎo)Hox B8 mRNA的切割(Yekta等,2004,Science 304-594)。否則,僅已知植物中的這種相互作用(Bartel和Bartel 2003,Plant Physiol 132-709)
已針對(duì)實(shí)現(xiàn)翻譯的有效抑制,對(duì)miRNA及其mRNA靶之間的堿基配對(duì)要求進(jìn)行了許多研究(Bartel 2004, Cell 116-281的綜述)。在哺乳動(dòng)物細(xì)胞中,miRNA的前8個(gè)核苷酸可能是重要的(Doench和Sharp 2004 GenesDev 2004-504)。然而,微RNA的其它部分也可參與mRNA結(jié)合。此外,在3’處的充分堿基配對(duì)可補(bǔ)償在5’處的不充分配對(duì)(Brennecke等,2005 PLoS 3-e85)。
[0104]在整個(gè)基因組上分析miRNA結(jié)合的計(jì)算研究表明了 miRNA 5’處的堿基2_7在靶結(jié)合中的特定作用,但也認(rèn)識(shí)到第一個(gè)核苷酸(發(fā)現(xiàn)通常為“A”)的作用(Lewis等,2005Cell 120-15)。同樣地,Krek 等人(2005,Nat Genet 37-495)使用核苷酸 1-7 或 2-8 來鑒定和證實(shí)靶。
[0105]mRNA中的靶位點(diǎn)可在5’ UTR,3' UTR或在編碼區(qū)中。引人關(guān)注的是,多個(gè)miRNA可通過識(shí)別相同位點(diǎn)或多個(gè)位點(diǎn)來調(diào)節(jié)相同的mRNA靶。大多數(shù)遺傳上鑒定的靶中多個(gè)miRNA結(jié)合部位的存在可表明,多個(gè)RISC的協(xié)同作用提供最有效的翻譯抑制。
[0106]miRNA可通過以下兩種機(jī)制中的任一種指導(dǎo)RISC減量調(diào)芐基因表達(dá):mRNA切割或翻譯阻抑。如果mRNA與miRNA具有某種程度的互補(bǔ)性,則miRNA可指定mRNA的切割。當(dāng)miRNA引導(dǎo)切割時(shí),切割可介于與miRNA的殘基10和11配對(duì)的核苷酸之間?;蛘?,如果miRNA與miRNA不具有必要程度的互補(bǔ)性,則miRNA可阻抑翻譯。翻譯阻抑在動(dòng)物中可能更普遍,因?yàn)閯?dòng)物在miRNA和結(jié)合部位之間可具有較低程度的互補(bǔ)性。
[0107]應(yīng)當(dāng)注意,任何miRNA和miRNA*對(duì)的5’端和3’端中可存在變化性。該變化性可能由于有關(guān)切割部位的Drosha和Dicer的酶促加工的變化性所致。miRNA和miRNA*的5’端和3’端處的變化性還可能由于pr1-miRNA和pre-miRNA的莖結(jié)構(gòu)的錯(cuò)配所致。莖鏈的錯(cuò)配可導(dǎo)致一群不同的發(fā)夾結(jié)構(gòu)。莖結(jié)構(gòu)的變化性還可導(dǎo)致由Drosha和Dicer切割的產(chǎn)物的變化性。
[0108]核酸
本文提供核酸。該核酸包含SEQ ID NO: 1-61的序列或其變體。變體可以是參考核苷酸序列的互補(bǔ)序列。變體還可以是與參考核苷酸序列或其互補(bǔ)序列基本相同的核苷酸序列。變體還可以是在嚴(yán)格條件下與參考核苷酸序列、其互補(bǔ)序列或與之基本相同的核苷酸序列雜交的核苷酸序列。
[0109]核酸的長(zhǎng)度可為10-250個(gè)核苷酸。核酸的長(zhǎng)度可為至少10、11、12、13、14、15、
16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、125、150、175、200或250個(gè)核苷酸??墒褂帽疚乃龊铣苫蛟诩?xì)胞(體外或體內(nèi))中合成或表達(dá)核酸。核酸可作為單鏈分子合成,并與基本互補(bǔ)的核酸雜交形成雙鏈體。可采用本領(lǐng)域技術(shù)人員熟知的方法,包括美國專利號(hào)6,506,559 (其通過引用予以結(jié)合)中描述的方法,將核酸以單鏈或雙鏈形式導(dǎo)入細(xì)胞、組織或器官或者能夠通過合成基因表達(dá)。
[0110]核酸復(fù)合體
核酸還可包含以下的一種或多種:肽、蛋白質(zhì)、RNA-DNA雜合體、抗體、抗體片段、Fab片段和適配體。
[0111]Pr1-mi RNA
核酸可包含pr1-miRNA或其變體的序列。pr1-miRNA序列可包含45-30,000、50-25,000、100-20,000、1,000-1, 500 或 80-100 個(gè)核苷酸。pr1-miRNA 的序列可包含本文所不的 pre_miRNA、miRNA 和 miRNA* 及其變體。pr1-miRNA 的序列可包含 SEQ ID NO: 1-8、26-37、38-49或其變體的序列。
[0112]pr1-miRNA可形成發(fā)夾結(jié)構(gòu)。發(fā)夾可包含基本互補(bǔ)的第一和第二核酸序列。第一和第二核酸序列可為37-50個(gè)核苷酸。第一和第二核酸序列可被8-12個(gè)核苷酸的第三序列分隔開。發(fā)夾結(jié)構(gòu)可具有小于-25 Kcal/摩爾的自由能,用Vienna算法計(jì)算,其默認(rèn)參數(shù)描述于 Hofacker 等,Monatshefte f.Chemie 125:167-188 (1994),其內(nèi)容結(jié)合到本文中。發(fā)夾可包含4-20、8-12或10個(gè)核苷酸的末端環(huán)。pr1-miRNA可包含至少19%腺苷核苷酸、至少16%胞嘧啶核苷酸、至少23%胸腺嘧啶核苷酸和至少19%鳥嘌呤核苷酸
Pre-miRNA
核酸還可包含pre-miRNA或其變體的序列。pre_miRNA序列可包含45-90、60-80或60-70個(gè)核苷酸。Pre-miRNA的序列可包含本文所不miRNA和miRNA*。Pre-miRNA的序列還可以是不包括priniRNA的5’和3’端的0-160個(gè)核苷酸的pr1-miRNA的序列。PreniRNA的序列可包含SEQ ID NO: 1-8、26-37、38-49或其變體的序列。
[0113]miRNA
核酸還可包含miRNA (包括miRNA*)或其變體的序列。miRNA序列可包含13_33、18_24或 21-23 個(gè)核苷酸。miRNA 還可包含總共至少 5、6、7、8、9、10、11、12、13、14、15、16、17、18、
`19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39 或 40 個(gè)核苷酸。miRNA的序列可以是pre-miRNA的起始13-33個(gè)核苷酸。miRNA的序列還可以是pre-miRNA的最后13-33個(gè)核苷酸。miRNA的序列可包含SEQ ID NO: 1_8、38_42、48或其變體的序列。
[0114]反-miRNA
核酸還可包含例如能夠通過與pr1-miRNA、pre-miRNA、mi RNA或mi RNA*結(jié)合(例如反義或RNA沉默),或通過與祀結(jié)合部位結(jié)合阻斷miRNA或miRNA*活性的反-miRNA的序列。反-miRNA可包含總共5-100或10-60個(gè)核苷酸。反-miRNA還可包含總共至少5、6、7、8、
9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個(gè)核苷酸。反-miRNA的序列可包含(a)與miRNA的5’基本同一或互補(bǔ)的至少5個(gè)核苷酸和與miRNA的5’端祀位點(diǎn)的側(cè)翼區(qū)基本互補(bǔ)的至少5_12個(gè)核苷酸,或(b)與miRNA的3’基本同一或互補(bǔ)的至少5-12個(gè)核苷酸和與miRNA的3’端靶位點(diǎn)的側(cè)翼區(qū)基本互補(bǔ)的至少5個(gè)核苷酸。反-miRNA的序列可包含SEQ ID NO: 1_8、38_42、48或其變體的互補(bǔ)序列。
[0115]靶的結(jié)合部位
核酸還可包含靶微RNA結(jié)合部位或其變體的序列。靶位點(diǎn)序列可包含總共5-100或10-60個(gè)核苷酸。靶位點(diǎn)序列還可包含總共至少5、6、7、8、9、10、11、12、13、14、15、16、17、
18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62 或 63 個(gè)核苷酸。靶位點(diǎn)序列可包含SEQ ID NO: 1-8、38-42、48的序列的至少5個(gè)核苷酸。[0116]合成基因
還提供合成基因,其包含與轉(zhuǎn)錄和/或翻譯調(diào)節(jié)序列有效連接的本文所述核酸。合成基因可能夠改進(jìn)具有針對(duì)本文所述核酸的結(jié)合部位的靶基因的表達(dá)??稍诩?xì)胞、組織或器官中改進(jìn)靶基因的表達(dá)。合成基因可通過標(biāo)準(zhǔn)重組技術(shù)進(jìn)行合成或衍生自天然存在的基因。合成基因還可包含合成基因序列的轉(zhuǎn)錄單元3’端處的終止子。合成基因還可包含選擇標(biāo)記。
[0117]載體
還提供包含本文所述合成基因的載體。載體可以是表達(dá)載體。表達(dá)載體可包含額外元件。例如,表達(dá)載體可具有2個(gè)復(fù)制系統(tǒng),允許其在兩種生物中維持,例如在一種宿主細(xì)胞中用于表達(dá),在第二種宿主細(xì)胞(例如細(xì)菌)中用于克隆和擴(kuò)增。對(duì)于整合型表達(dá)載體,表達(dá)載體可含有至少一個(gè)與宿主細(xì)胞基因組同源的序列,優(yōu)選兩個(gè)位于表達(dá)構(gòu)建體側(cè)翼的同源序列??赏ㄟ^選擇合適的同源序列以包括在載體中,將整合型載體引導(dǎo)至宿主細(xì)胞的特定基因座。載體還可包含選擇標(biāo)記基因以供選擇轉(zhuǎn)化的宿主細(xì)胞。
[0118]宿主細(xì)胞
還提供包含本文所述載體、合成基因或核酸的宿主細(xì)胞。細(xì)胞可以是細(xì)菌、真菌、植物、昆蟲或動(dòng)物細(xì)胞。例如宿主細(xì)胞系可以是DG44和DUXBll (中國倉鼠卵巢系,DHFR-)、HELA(人宮頸癌)、CVI (猴腎系)、COS (具有SV40 T抗原的CVI的衍生物)、R1610 (中國倉鼠成纖維細(xì)胞)、BALBC/3T3 (小鼠成纖維細(xì)胞)、HAK (倉鼠腎系)、SP2/0 (小鼠骨髓瘤)、P3x63-Ag3.653 (小鼠骨髓瘤)、BFA_lclBPT (牛內(nèi)皮細(xì)胞)、RAJI (人淋巴細(xì)胞)和293 (人腎)。宿主細(xì)胞系可獲自商業(yè)服務(wù)、美國組織培養(yǎng)物保藏中心(American TissueCulture Collection)或來自已發(fā)表的文獻(xiàn)。
[0119]探針
本文提供探針。探針可包含核酸。探針的長(zhǎng)度可為8-500、10-100或20-60個(gè)核苷酸。探針的長(zhǎng)度還可為至少 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280 或
300個(gè)核苷酸。探針可包含18-25個(gè)核苷酸的核酸。
[0120]探針可能夠通過一個(gè)或多個(gè)類型的化學(xué)鍵、通常通過互補(bǔ)堿基配對(duì)、通常通過氫鍵形成,而與互補(bǔ)序列的靶核酸結(jié)合。根據(jù)雜交條件的嚴(yán)格性,探針可結(jié)合與探針序列缺乏完全互補(bǔ)性的靶序列。探針可以是單鏈的或部分單鏈的和部分雙鏈的。探針的鏈性受靶序列的結(jié)構(gòu)、組成和性質(zhì)的支配。探針可被直接標(biāo)記或間接標(biāo)記。
[0121]試驗(yàn)探針
探針可以是試驗(yàn)探針。試驗(yàn)探針可包含與miRNA、miRNA*、pre-miRNA或pr1-miRNA互補(bǔ)的核酸序列。試驗(yàn)探針的序列可選自SEQ ID NO: 17-24和56-61。
[0122]接頭序列
探針還可包含接頭。接頭的長(zhǎng)度可為10-60個(gè)核苷酸。接頭的長(zhǎng)度可為20-27個(gè)核苷酸。接頭可具有足夠的長(zhǎng)度,以允許探針為45-60個(gè)核苷酸的總長(zhǎng)度。接頭可能不能夠形成穩(wěn)定的二級(jí)結(jié)構(gòu),或者可能不能夠自身折置,或者可能不能夠在探針?biāo)薎fe的非接頭部分上折疊。接頭的序列可能不出現(xiàn)在探針非接頭核酸從中衍生的動(dòng)物基因組中。
[0123]反轉(zhuǎn)錄可通過靶RNA的反轉(zhuǎn)錄來產(chǎn)生cDNA的靶序列。產(chǎn)生cDNA的方法可反轉(zhuǎn)錄多腺苷酸化RNA或備選具有連接的銜接序列的RNA。
[0124]使用與RNA連接的銜接序列進(jìn)行反轉(zhuǎn)錄
RNA可在反轉(zhuǎn)錄前與銜接序列連接。連接反應(yīng)可通過T4 RNA連接酶進(jìn)行以在RNA的3’端與銜接序列連接。反轉(zhuǎn)錄(RT)反應(yīng)然后可使用包含與銜接序列的3’端互補(bǔ)的序列的引物進(jìn)行。
[0125]使用與RNA連接的多腺苷酸化序列進(jìn)行反轉(zhuǎn)錄
可使用包含5’銜接序列的聚(T)引物,將多腺苷酸化RNA用于反轉(zhuǎn)錄(RT)反應(yīng)。聚(T)序列可包含8、9、10、11、12、13或14個(gè)連續(xù)的胸腺嘧啶。反轉(zhuǎn)錄引物可包含SEQ ID NO:25。
[0126]RNA 的 RT-PCR
可使用包含至少15個(gè)與靶核酸互補(bǔ)的核酸和5’尾序列的特異性正向引物、與銜接序列的3’端互補(bǔ)的反向引物和包含至少8個(gè)與靶核酸互補(bǔ)的核酸的探針,通過實(shí)時(shí)PCR使RNA的反轉(zhuǎn)錄物擴(kuò)增。探針可與銜接序列的5’端部分互補(bǔ)。
[0127]靶核酸的PCR
本文描述了擴(kuò)增靶核酸的方法。擴(kuò)增可以是通過包括PCR在內(nèi)的方法。PCR反應(yīng)的第一循環(huán)的退火溫度可為561:、571:、581:、591:或601:。第一循環(huán)可包括1-10個(gè)循環(huán)。PCR反應(yīng)的其余循環(huán)可為60°C。其余循環(huán)可包括2-40個(gè)循環(huán)。退火溫度可使PCR更靈敏。PCR可產(chǎn)生可用作較高嚴(yán)格性PCR模板的較長(zhǎng)產(chǎn)物。
[0128]正向引物
PCR反應(yīng)可包括正向引物。正向引物可包含15、16、17、18、19、20或21個(gè)與靶核酸相同
的核苷酸。
[0129]正向引物的3’端可能對(duì)祀核酸和親緣核酸(sibling nucleic acid)之間序列的
差異敏感。
[0130]正向引物還可包含5’突出尾。5’尾可提高正向引物的解鏈溫度。5’尾的序列可包含與靶核酸從中分離的動(dòng)物的基因組不同的序列。5’尾的序列還可以是合成的。5’尾可包含 8、9、10、11、12、13、14、15 或 16 個(gè)核苷酸。正向引物可包含 SEQ ID NO: 9_16、50_55。
[0131]反向引物
PCR反應(yīng)可包括反向引物。反向引物可與靶核酸互補(bǔ)。反向引物還可包含與銜接序列互補(bǔ)的序列。與銜接序列互補(bǔ)的序列可包含12-24個(gè)核苷酸。
[0132]生物芯片
還提供生物芯片。生物芯片可包含固體基質(zhì),其包含本文所述的連接探針或眾多探針。探針可能夠在嚴(yán)格雜交條件下與靶序列雜交。探針可在基質(zhì)上的空間確定的位置上連接。每個(gè)靶序列可使用多于一種探針,或?yàn)橹丿B探針或?yàn)獒槍?duì)特定靶序列的不同部分的探針。探針可能夠與本領(lǐng)域技術(shù)人員了解的單一病癥相關(guān)的靶序列雜交。探針或可先合成,隨后與生物芯片連接,或可在生物芯片上直接合成。
[0133]固體基質(zhì)可以是經(jīng)改性以含有適于探針連接或締合的離散的各個(gè)位置并適于至少一種檢測(cè)方法的材料?;|(zhì)材料的代表性實(shí)例包括玻璃和經(jīng)改性的或功能化的玻璃、塑料(包括丙烯酸酯、聚苯乙烯以及苯乙烯和其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonJ等)、多糖、尼龍或硝酸纖維素、樹脂、二氧化硅或二氧化硅型材料包括硅(silicon)和改性娃、碳、金屬、無機(jī)玻璃和塑料。在沒有明顯發(fā)突光的情況下,基質(zhì)便可供進(jìn)行光學(xué)檢測(cè)。
[0134]基質(zhì)可以是平面的,但是也可使用其它構(gòu)型的基質(zhì)。例如,可將探針置于管的內(nèi)表面用于穿流樣品分析(flow-through sample analysis)以使樣品體積減至最小。同樣地,基質(zhì)可以是柔性的,例如軟泡沫塑料,包括由特定塑料制成的閉孔泡沫塑料(closed cellfoam)。
[0135]生物芯片的基質(zhì)和探針可用化學(xué)官能團(tuán)衍生化用于兩者隨后的連接。例如,生物芯片可用化學(xué)官能團(tuán)衍生化,化學(xué)官能團(tuán)包括但不限于氨基、羧基、橋氧基或硫醇基。利用這些官能團(tuán),探針可用探針上的官能團(tuán)直接連接或使用接頭間接連接。
[0136]探針可通過5’端、3’端或通過內(nèi)部核苷酸與固相支持體連接。
[0137]探針還可與固相支持體非共價(jià)連接。例如,可制備生物素化寡核苷酸,其可與鏈霉抗生物素共價(jià)包被的表面結(jié)合,導(dǎo)致連接?;蛘?,可采用諸如光聚合和光刻術(shù)等技術(shù),在表面上合成探針。
[0138]診斷學(xué)
還提供診斷方法。所述方法包括檢測(cè)生物樣品中的肺特異性癌癥相關(guān)核酸的差異表達(dá)水平。樣品可來源于患者?;颊叩陌┌Y狀態(tài)及其組織學(xué)類型的診斷可供預(yù)后和治療策略的選擇。此外,可通過測(cè)定臨時(shí)表達(dá)的癌癥相關(guān)核酸,對(duì)細(xì)胞的發(fā)育階段分類。
[0139]可以進(jìn)行標(biāo)記探 針與組織切片或涂片的原位雜交。當(dāng)比較個(gè)體和標(biāo)準(zhǔn)品之間的指紋時(shí),技術(shù)人員可根據(jù)研究結(jié)果做出診斷、預(yù)后或預(yù)測(cè)。還要了解,指示診斷的基因可不同于指示預(yù)后的基因,而且細(xì)胞狀況的分子概況分析(molecular profiling)可導(dǎo)致反應(yīng)性情況或不應(yīng)性情況間的差異,或者可預(yù)測(cè)結(jié)果。
[0140]試劑盒
還提供試劑盒,試劑盒可包括本文所述核酸連同以下的任一種或全部:測(cè)定試劑、緩沖液、探針和/或引物和無菌鹽水或其它藥學(xué)上可接受的乳劑和混懸劑基質(zhì)(suspensionbase)。另外,試劑盒可包括含有用法說明(例如方案)的指導(dǎo)材料,用于實(shí)施本文所述方法。
[0141]例如,試劑盒可用于靶核酸序列的擴(kuò)增、檢測(cè)、鑒定或定量測(cè)定。試劑盒可包含聚(T)引物、正向引物、反向引物和探針。
[0142]本文所述組合物的任一種都可包括在試劑盒中。在非限制性實(shí)例中,試劑盒中包括用于分離miRNA、標(biāo)記miRNA和/或使用陣列評(píng)價(jià)miRNA群的試劑。試劑盒還可包括用于產(chǎn)生或合成miRNA探針的試劑。因此,試劑盒可在合適的容器裝置中包括用于通過摻入標(biāo)記的核苷酸或隨后標(biāo)記但尚未標(biāo)記的核苷酸以標(biāo)記miRNA的酶。其還可包括一種或多種緩沖液,例如反應(yīng)緩沖液、標(biāo)記緩沖液、洗漆緩沖液或雜交緩沖液、用于制備miRNA探針的化合物、用于原位雜交的組分和用于分離miRNA的組分。本發(fā)明的其它試劑盒可包括用于制備包含miRNA的核酸陣列的組分,因此,可包括例如固相支持體。
[0143]提供下面的實(shí)施例,以便更全面地說明本發(fā)明的一些實(shí)施方案。然而,其絕不應(yīng)解釋為對(duì)本發(fā)明寬泛范圍的限制。實(shí)施例
[0144]實(shí)施例1
實(shí)驗(yàn)步驟
1.腫瘤樣品
來自肺癌樣品的不同組織學(xué)亞型的229個(gè)福爾馬林固定石蠟包埋的(FFPE)切除樣品、FNA 和 FNB (表 I)獲自下列來源:Sheba Medical Center, Tel Hashomer, Israel ;RabinMedical Center, Petah Tikva, Israel ;和 ABS Inc., Wilmington, DE0 按照各研究所公共機(jī)構(gòu)評(píng)審委員會(huì)(institute,s institutional review board)或IRB等同準(zhǔn)則,獲得所有樣品的公共機(jī)構(gòu)評(píng)審認(rèn)可。
[0145]表1:腫瘤樣品
【權(quán)利要求】
1.一種用于區(qū)分肺癌的特定亞型的方法,所述方法包括:自受試者獲得生物樣品;測(cè)定所述樣品中的選自SEQ ID NO: 1-8、其片段和與之具有至少約80%同一性的序列的核酸序列的表達(dá)譜;并將所述表達(dá)譜與參比表達(dá)譜進(jìn)行比較;其中所述表達(dá)譜與所述參比表達(dá)譜的比較結(jié)果表明所述肺癌。
2.權(quán)利要求1的方法,其中所述肺癌選自鱗狀細(xì)胞癌、非鱗狀非小細(xì)胞肺癌(NSCLC)、肺類癌和小細(xì)胞肺癌。
3.權(quán)利要求1的方法,其中所述核酸序列選自SEQID NO: 3、7、8 ;其片段和與之具有至少約80%同一性的序列,且其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有肺類癌。
4.權(quán)利要求1的方法,其中所述核酸序列選自SEQID NO: 1、其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有小細(xì)胞肺癌(SCLC)。
5.權(quán)利要求1的方法,其中所述核酸序列選自SEQID NO: 2、5、6 ;其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有非鱗狀非小細(xì)胞肺癌(NSCLC)。
6.權(quán)利要求1的方法,其中所述核酸序列選自SEQID NO: 4、其片段和與之具有至少約80%同一性的序列,其中與所述參比表達(dá)譜相比,所述核酸序列相對(duì)高的表達(dá)水平表明有鱗狀細(xì)胞癌。
7.權(quán)利要求1的方法, 其中所述生物樣品選自體液、細(xì)胞系和組織樣品。
8.權(quán)利要求7的方法,其中所述組織是新鮮的、冷凍的、固定的、蠟包埋的或福爾馬林固定石蠟包埋的(FFPE)組織。
9.權(quán)利要求7的方法,其中所述組織樣品是肺腫瘤樣品。
10.權(quán)利要求1的方法,其中所述方法包括測(cè)定至少兩個(gè)核酸序列的表達(dá)譜。
11.權(quán)利要求10的方法,其中所述方法還包括組合所述核酸序列的一個(gè)或多個(gè)表達(dá)比。
12.權(quán)利要求1的方法,其中所述表達(dá)譜通過選自核酸雜交、核酸擴(kuò)增及其組合的方法測(cè)定。
13.權(quán)利要求12的方法,其中所述核酸雜交使用固相核酸生物芯片陣列或原位雜交進(jìn)行。
14.權(quán)利要求12的方法,其中所述核酸擴(kuò)增方法是實(shí)時(shí)PCR。
15.權(quán)利要求14的方法,其中所述實(shí)時(shí)PCR方法包括正向和反向引物。
16.權(quán)利要求15的方法,其中所述正向引物包含選自以下的序列:SEQID NO: 9-16的任一個(gè)和與之有至少約80%同一性的序列。
17.權(quán)利要求16的方法,其中所述實(shí)時(shí)PCR方法還包括探針。
18.權(quán)利要求17的方法,其中所述探針包含選自SEQID NO: 17-24的任一個(gè)的序列。
19.一種用于肺癌分類的試劑盒,所述試劑盒包含探針,所述探針包含與選自SEQ IDNO: 1-8、其片段和與之具有至少約80%同一性的序列的序列互補(bǔ)的核酸序列。
20.權(quán)利要求19的試劑盒,其中所述探針包含選自SEQID NO: 17-24和與之具有至少約80%同一性的序列的核酸序列。
21.權(quán)利要求20的試劑盒,其中所述試劑盒還包含正向引物,所述正向引物包含選自SEQ ID NO: 9-16的任一個(gè)和與`之具有至少約80%同一性的序列的序列。
【文檔編號(hào)】C12Q1/68GK103764844SQ201280026211
【公開日】2014年4月30日 申請(qǐng)日期:2012年3月26日 優(yōu)先權(quán)日:2011年3月28日
【發(fā)明者】G.里斯維克亞奈, H.本賈明 申請(qǐng)人:羅塞塔金諾米克斯有限公司