專利名稱:活性與潛伏性結(jié)核分枝桿菌感染的血液轉(zhuǎn)錄簽名的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總的來說涉及結(jié)核分枝桿菌(Mycobacterium tuberculosis)感染的領(lǐng)域,并且更具體地涉及用于在治療之前、期間和之后,診斷、預(yù)后和監(jiān)測(cè)活性結(jié)核分枝桿菌感染和疾病進(jìn)展的方法、試劑盒和系統(tǒng),所述疾病表現(xiàn)為潛伏性的或無癥狀的。
背景技術(shù):
不限制本發(fā)明的范圍的前提下,將其背景結(jié)合結(jié)核分枝桿菌感染的鑒定和治療進(jìn)行描述。 肺結(jié)核(PTB)是結(jié)核分枝桿菌(M. tuberculosis)引起的全世界發(fā)病和死亡的主要的和增長的原因。然而,感染了結(jié)核分枝桿菌的多數(shù)個(gè)體保持無癥狀,將感染保持在潛伏形式,并認(rèn)為該潛伏狀態(tài)是通過主動(dòng)免疫應(yīng)答維持的(WH0;Kaufmann,SH&McMichael, AJ. , Nat Med, 2005)0這受到報(bào)道的支持,所述報(bào)道顯示使用抗-TNF抗體治療患克羅恩病(Crohn’s Disease)或者類風(fēng)濕關(guān)節(jié)炎(Rheumatoid Arthritis)的患者,引起自身免疫癥狀的改善,然而另ー個(gè)方面在事先接觸結(jié)核分枝桿菌(Keane)的患者中引起TB的再活化。對(duì)結(jié)核分枝桿菌的免疫應(yīng)答是多因子的,并包括遺傳學(xué)上確定的宿主因子,如Thl軸的TNF和IFN-Y以及IL-12 (綜述于Casanova, Ann Rev; Newport)。然而,來自成年人肺TB患者的免疫細(xì)胞可以產(chǎn)生IFN-Y、IL-12和TNF,并且IFN-Y療法不幫助改善疾病(綜述于Reljic, 2007, J Interferon&CytRes.,27,353-63),說明了更廣泛數(shù)量的宿主免疫因子牽涉到抗結(jié)核分枝桿菌的保護(hù)以及潛伏性保持中。因此,在潛伏性與活性TB中所誘導(dǎo)的宿主因子的認(rèn)識(shí)可以提供關(guān)于免疫應(yīng)答的信息,所述免疫應(yīng)答可以控制結(jié)核分枝桿菌的感染。PTB的診斷由于多種原因可能很困難并且有問題。首先,通過顯微鏡檢查(涂布陽性)來證明典型的結(jié)核分枝桿菌在痰中的存在僅有50-70%的靈敏性,并且陽性診斷要求通過培養(yǎng)分離結(jié)核分枝桿菌,這可能花費(fèi)長達(dá)8周。此外,ー些患者的痰是涂布陰性的,或者不能產(chǎn)生痰,故需要通過支氣管鏡檢查法這種侵入性操作進(jìn)行額外的取樣。由于PTB的診斷中的這些限制,有時(shí)涂布陰性的患者要測(cè)試結(jié)核菌素(PPD)皮膚反應(yīng)性(曼托試驗(yàn))。然而,結(jié)核菌素(PB))皮膚反應(yīng)性不能區(qū)分BCG接種、潛伏性的或者活性的TB。針對(duì)這個(gè)問題,已經(jīng)開發(fā)了證明對(duì)特異性結(jié)核分枝桿菌抗原的免疫反應(yīng)性的檢測(cè),所述抗原在BCG中不存在。然而,通過在Y干擾素釋放檢測(cè)(IGRA)中通過血細(xì)胞產(chǎn)生IFN-Y而測(cè)量的對(duì)這些結(jié)核分枝桿菌抗原的反應(yīng)性并不將潛伏性疾病與活性疾病區(qū)分開。在臨床上,當(dāng)使用pro經(jīng)皮內(nèi)激發(fā)患者,在沒有活性疾病的臨床癥狀或體征或者放射學(xué)顯示的情況下具有IGRA陽性結(jié)果時(shí),通過延遲型高度靈敏反應(yīng)來定義潛伏性TB。潛伏性的/潛在的肺結(jié)核(TB)的再活化表現(xiàn)出具有向其他個(gè)體傳播的風(fēng)險(xiǎn)的主要健康危害,因此反映潛伏性的和活性的TB患者的區(qū)別的生物標(biāo)記物在疾病控制中將是有用的,尤其是由于抗分枝桿菌的藥物治療是困難的,并且可以導(dǎo)致嚴(yán)重的副作用。多數(shù)的感染了結(jié)核分枝桿菌的個(gè)體保持無癥狀的,據(jù)估計(jì)全世界三分之一的人口潛伏地被該細(xì)菌感染,這為該疾病的傳播提供了極大的庫。對(duì)于描述為潛伏地被感染的人中,5-15%將在其一生中發(fā)展出活性的TB疾病7’8。因此,潛伏性TB患者代表在臨床上不同的分類,從大部分會(huì)終生保持無癥狀的患者,到那些會(huì)進(jìn)展到疾病再激活的患者9。潛伏性TB的診斷僅僅基于免疫致敏作用的跡象,一般地基于對(duì)結(jié)核分枝桿菌抗原的皮膚反應(yīng),該測(cè)試的特異性受到對(duì)非致病性分枝桿菌的陽性反應(yīng)的影響,所述的非致病性分枝桿菌包括疫苗BCG。更近的檢測(cè)測(cè)定血細(xì)胞針對(duì)特定的結(jié)核分枝桿菌抗原(IGRA)分泌的IFN- Y,其較少地遇到此問題,但是和皮膚測(cè)試一祥,其不能將潛伏性疾病與活性疾病區(qū)分開,也不能清楚地識(shí)別那些可以進(jìn)展為活性疾病的患者 ' 識(shí)別出那些最具有再激活風(fēng)險(xiǎn)的人,將幫助進(jìn)行靶向的預(yù)防性治療,這一點(diǎn)是重要的,由于抗分枝桿菌藥物治療漫長并且可以導(dǎo)致嚴(yán)重的副作用。因此,迫切需要用于診斷、治療和接種的新型工具,但是開發(fā)這些的努力受限于對(duì)TB復(fù)雜的潛在致病性了解不完全。
發(fā)明內(nèi)容
本發(fā)明包括相對(duì)于健康的對(duì)照,用于識(shí)別潛伏性的與活性的結(jié)核(TB)患者的方法·和試劑盒。在一個(gè)實(shí)施方案中,使用微陣列分析血液的差異性的和相反的免疫簽名來測(cè)定、診斷、跟蹤和治療潛伏性的與活性的結(jié)核(TB)患者。本發(fā)明首次提供了區(qū)分TB感染異質(zhì)性的能力,該能力可以用于測(cè)定哪些具有潛伏性TB的個(gè)體應(yīng)該由于活性和不是潛伏性/無癥狀性TB感染而給予抗分枝桿菌化學(xué)療法。在一個(gè)實(shí)施方案中,本發(fā)明包括了預(yù)測(cè)表現(xiàn)為潛伏性的/無癥狀的活性結(jié)核分枝桿菌感染的方法,所述的方法包括從懷疑感染了結(jié)核分枝桿菌的患者獲得患者的基因表達(dá)數(shù)據(jù)集;將該患者的基因表達(dá)數(shù)據(jù)集分成與結(jié)核分枝桿菌感染相關(guān)的ー個(gè)或多個(gè)基因模塊;并且將ー個(gè)或多個(gè)基因模塊中的每ー個(gè)的患者的基因表達(dá)數(shù)據(jù)集與來自也分成了相同基因模塊的非患者的基因表達(dá)數(shù)據(jù)集相比;其中在ー個(gè)或多個(gè)基因模塊的患者的基因表達(dá)數(shù)據(jù)集中,基因表達(dá)的整體上升或者下降指示了活性的結(jié)核分枝桿菌感染而不是潛伏性的/無癥狀的結(jié)核分枝桿菌感染。在ー個(gè)方面,該方法還包括使用測(cè)定的比較基因產(chǎn)物信息來制定至少ー種診斷、預(yù)后或者治療方案的步驟。在另ー個(gè)方面,該方法還可以包括將具有潛伏性TB的患者與活性TB的患者區(qū)分的步驟。在ー個(gè)方面,患者的基因表達(dá)數(shù)據(jù)集來自全血、外周血液?jiǎn)魏思?xì)胞或者唾液中的至少ー個(gè)中的細(xì)胞。在另ー個(gè)方面,將患者的基因表達(dá)數(shù)據(jù)集和至少 10、20、40、50、70、80、90、100、125、150、200、250、300、350 或者 393 個(gè)選自表2中基因的基因進(jìn)行比較。在另ー個(gè)方面,將患者的基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3, M2. 8、Ml. 5, M2. 6, M2. 2 和 M3. I 進(jìn)行比較。在另ー個(gè)方面,與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。在另ー個(gè)方面,與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)的基因中上升,在T細(xì)胞相關(guān)的基因中下降,在骨髓相關(guān)的基因中上升,在嗜中性粒細(xì)胞相關(guān)的轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中上升。在另ー個(gè)方面,患者的疾病狀態(tài)進(jìn)ー步通過患者肺部的放射學(xué)分析來測(cè)定。在另ー個(gè)方面,該方法還包括在患者經(jīng)治療后測(cè)定經(jīng)治療的患者的基因表達(dá)數(shù)據(jù)集并測(cè)定經(jīng)治療的患者的基因表達(dá)數(shù)據(jù)集是否已經(jīng)恢復(fù)到正常的基因表達(dá)數(shù)據(jù)集,從而確定該患者是否已經(jīng)被治療的步驟。在另ー個(gè)實(shí)施方案中,本發(fā)明是用于在懷疑感染了結(jié)核分枝桿菌的患者中區(qū)分活性的和潛伏性的結(jié)核分枝桿菌感染的方法,該方法包括從得自具有活性的結(jié)核分枝桿菌感染的第一臨床組中獲得第一基因表達(dá)數(shù)據(jù)集,從得自具有潛伏性的結(jié)核分枝桿菌感染患者的第二臨床組中獲得第二基因表達(dá)數(shù)據(jù)集,以及從得自未感染個(gè)體的臨床組中獲得第三基因表達(dá)數(shù)據(jù)集;產(chǎn)生基因簇(gene cluster)數(shù)據(jù)集,所述的基因簇?cái)?shù)據(jù)集包括在第一、第二和第三數(shù)據(jù)集的任意兩者之間基因的差異表達(dá);并且確定指示了潛伏性感染、活性感染或者健康的獨(dú)特表達(dá)/代表性模式,其中所述的患者基因表達(dá)數(shù)據(jù)集包括從模塊Ml. 3、M2. 8、Ml. 5、M2. 6、M2. 2 和 M3. I 的至少ー個(gè)中獲得的至少 6、10、20、40、50、70、80、90、100、125,150或200個(gè)基因。在再一個(gè)實(shí)施方案中,本發(fā)明是用于在懷疑感染結(jié)核分枝桿菌的患者中診斷感染的試劑盒,所述的試劑盒包括用于從患者獲得患者基因表達(dá)數(shù)據(jù)集的基因表達(dá)檢測(cè)器,其中所表達(dá)的基因得自患者的全血;以及能夠?qū)⒒虮磉_(dá)數(shù)據(jù)集和事先定義的與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊數(shù)據(jù)集進(jìn)行比較的處理器,并且所述的處理器能區(qū)分感染的和未感染的患者,其中全血證實(shí)了與匹配的未感染患者相比,在一個(gè)或多個(gè)轉(zhuǎn)錄基因表達(dá)模塊中多核苷酸水平的總體變化,從而區(qū)分活性的和潛伏性的結(jié)核分枝桿菌感染。在ー個(gè)方面,患者的基因表達(dá)數(shù)據(jù)集得自外周血液?jiǎn)魏思?xì)胞。在另ー個(gè)方面,將患者的基因表達(dá)數(shù)據(jù)集 和至少 10、20、40、50、70、80、90、100、125、150、200、250、300、350 或者 393 個(gè)選自表 2 中基因的基因進(jìn)行比較。在另ー個(gè)方面,將所述的患者基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3,M2. 8,Ml. 5,M2. 6,M2. 2 和 M3. I 進(jìn)行比較。在另ー個(gè)方面,與結(jié)核分枝桿菌相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。在另ー個(gè)方面,與結(jié)核分枝桿菌相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)的基因中下降,在T細(xì)胞相關(guān)的基因中下降,在骨髓相關(guān)基因中上升,在嗜中性粒細(xì)胞相關(guān)的轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中上升。在另ー個(gè)方面,所述的基因選自 PDL-I、CASP5、CR1、CASP5、TLR5、MAPK14、STX11、BCL6 和 C5。本發(fā)明的另ー個(gè)實(shí)施方案是用于診斷具有活性的和潛伏性的結(jié)核分枝桿菌感染的患者的系統(tǒng),該系統(tǒng)包括用于從患者獲得患者基因表達(dá)數(shù)據(jù)集的基因表達(dá)檢測(cè)器,其中所表達(dá)的基因得自患者的全血;以及能夠?qū)⒒虮磉_(dá)數(shù)據(jù)集和事先定義的與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊數(shù)據(jù)集進(jìn)行比較的處理器,并且所述的處理器能區(qū)分感染的和未感染的患者,其中全血證實(shí)了與匹配的未感染患者相比,在一個(gè)或多個(gè)轉(zhuǎn)錄基因表達(dá)模塊中多核苷酸水平的總體變化,從而區(qū)分活性的和潛伏性的結(jié)核分枝桿菌感染,其中所述的基因模塊數(shù)據(jù)集包括模塊Ml. 3,M2. 8,Ml. 5,M2. 6,M2. 2和M3. I中的至少ー個(gè)。在ー個(gè)方面,將患者的基因表達(dá)數(shù)據(jù)集和至少 10、20、40、50、70、80、90、100、125、150、200、250、300、350或者393個(gè)選自表2中基因的基因進(jìn)行比較。在另ー個(gè)方面,將所述的患者基因表達(dá)數(shù)據(jù)集和至少 10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3、M2. 8、Ml. 5、M2. 6、M2. 2和M3. I進(jìn)行比較。在另ー個(gè)方面,與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。在另ー個(gè)方面,與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)的基因中下降,在T細(xì)胞相關(guān)的基因中下降,在骨髓相關(guān)基因中上升,在嗜中性粒細(xì)胞相關(guān)的轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中上升。在另ー個(gè)方面,所述的基因選自roL-l、CASP5、CRl、CASP5、TLR5、MAPK14、STX1UBCL6 和 C5。
為了更完全地理解本發(fā)明的特征和優(yōu)點(diǎn),在此參考本發(fā)明的詳述以及所附的圖,并且其中圖Ia到lc?;钚訲B的獨(dú)特全血轉(zhuǎn)錄簽名。熱カ圖(heatmap)的各列代表了單個(gè)的基因,并且每ー欄代表了單個(gè)的參與者。在整個(gè)紙張上轉(zhuǎn)錄物的豐度是由圖的底部的顏色尺度來指示的(紅色,高的;黃色,中間的;藍(lán)色,低的)。(Ia)通過分層聚類組織在訓(xùn)練集中的393個(gè)最顯著地差別表達(dá)的基因。(Ib)使用在同一個(gè)基因樹中排列的相同的393個(gè)轉(zhuǎn)錄物列表來分析來自獨(dú)立的測(cè)試集中的數(shù)據(jù),所述分析通過Spearman相關(guān)進(jìn)行分層聚類,所述的Spearman相關(guān)使用表示為各個(gè)底部的色塊的產(chǎn)生條件樹的平均距離法(沿著熱カ圖的上水平邊緣)和研究分組(即臨床表型)。(Ic)如前文所述地分析了南非招募的獨(dú)立驗(yàn)證集。
圖2a到2c :活性TB的轉(zhuǎn)錄簽名與疾病的放射照相程度相關(guān)聯(lián)。三名獨(dú)立的臨床醫(yī)師在不知悉其他數(shù)據(jù)的情況下,評(píng)價(jià)了訓(xùn)練集和獨(dú)立的測(cè)試集中各個(gè)患者的胸部射線照片(圖9a)。(2a)在獨(dú)立的測(cè)試集中,對(duì)于每位具有活性TB的患者顯示了 393個(gè)轉(zhuǎn)錄物的圖譜。舉例說明了晩期疾病,中度疾病、輕微疾病和沒有疾病。(2b,2c)根據(jù)疾病的放射照相程度對(duì)圖譜進(jìn)行分組,并且使用Kruskal-Wallis ANOVA來比較各組的平均“與健康的分子距離”(另外的方法),所述比較使用Dunn的多重比較事后檢驗(yàn)來對(duì)各組之間進(jìn)行比較
(氺林=ρ〈0· 0001)。圖3a到3d?;钚訲B的轉(zhuǎn)錄簽名在成功的處理中被減少。(3a)具有活性TB (活性的)的7名患者在抗分枝桿菌治療起始后的2個(gè)月和12個(gè)月重新取樣,并且與來自獨(dú)立的測(cè)試集中的健康對(duì)照(對(duì)照,n=12)進(jìn)行比較。(3b)在開始抗分枝桿菌治療后2個(gè)月和12個(gè)月時(shí)間的胸部放射照相,顯示了 7名患者中的2名患者(標(biāo)記為“4”或“7”)。這些個(gè)體的圖譜在前文中顯示,所述圖譜通過相同的多種指示劑進(jìn)行標(biāo)記。(3c)計(jì)算了各個(gè)患者在各個(gè)時(shí)間點(diǎn)的“與健康的分子距離”,并且利用Spearman相關(guān)使用治療起始后的時(shí)間進(jìn)行了比較。(3d)使用Friedman檢驗(yàn)比較了各個(gè)時(shí)間點(diǎn)的平均“與健康的分子距離”,所述Friedman檢驗(yàn)使用Dunn的多重比較事后檢驗(yàn)來對(duì)時(shí)間點(diǎn)之間進(jìn)行比較。水平線表明了中值、第5個(gè)和第95個(gè)百分位。圖4a到4e?;钚訲B的全血轉(zhuǎn)錄簽名反映了細(xì)胞組成的明顯變化和基因表達(dá)的絕對(duì)水平上的變化。(4a)活性TB與健康對(duì)照相比的基因表達(dá)在事先設(shè)定的模塊框架中作圖。點(diǎn)的密度代表了對(duì)于各個(gè)模塊而言,顯著差異表達(dá)的轉(zhuǎn)錄物的比例(紅色=提高,藍(lán)色=降低,轉(zhuǎn)錄物豐度)。此前通過無偏向的文獻(xiàn)分析來確定的功能判讀(interpretation)通過在下方的顔色代碼的網(wǎng)格指示(4b),來自試驗(yàn)集健康對(duì)照(對(duì)照)和活性TB患者(活性的)的全血通過流式細(xì)胞法分析⑶3+⑶4+和⑶3+⑶8+T細(xì)胞以及⑶19+⑶20+B細(xì)胞。誤差線=中值。(4c)來自試驗(yàn)集對(duì)照(對(duì)照)和活性TB患者(活性的)全血通過流式細(xì)胞法分析⑶14+的單核細(xì)胞、⑶14+CD16+的炎癥單核細(xì)胞和⑶16+的嗜中性粒細(xì)胞(neutrophil)。誤差線=中值。(4d)在此處顯示了干擾素信號(hào)傳導(dǎo)途徑的Ingenuity Pathways分析典型途徑,各個(gè)基因產(chǎn)物使用對(duì)應(yīng)于其功能的符號(hào)來識(shí)別(說明在右側(cè)),并且在訓(xùn)練集的活性TB患者中過度代表的轉(zhuǎn)錄物顯示為紅色陰影。(4e)來自健康對(duì)照(對(duì)照)和具有活性肺TB (活性的)的CXCLlO的血清水平。使用雙側(cè)Mann-Whitney檢驗(yàn)進(jìn)行統(tǒng)計(jì)比較。水平線表明了各組的平均值,側(cè)線表明了 95%的置信區(qū)間。圖4f和4g?;钚訲B的獨(dú)特全血86種基因轉(zhuǎn)錄簽名與其他疾病是有區(qū)別的。(4f) TB和其他疾病的患者中86種基因簽名的比較,其針對(duì)其自身的對(duì)照進(jìn)行歸ー化;患者為TB (訓(xùn)練,n=13 ;對(duì)照,n=12),TB (SA,n=20 ;對(duì)照=12),A 群鏈球菌(Str?。籲=23 ;對(duì)照=12),葡萄球菌(Staph ;n=40 ;對(duì)照=12), Still 病(Still,s ;n=31 ;對(duì)照=22),成年人(SLE ;n=29 ;對(duì)照=16)以及兒科的SLE (pSLE ;n=49 ;對(duì)照=11)。(4g)在TB患者中治療2和12個(gè)月后,86種基因簽名的表達(dá)水平。圖4h。TB (試驗(yàn)集)和不同疾病的基因表達(dá)(疾病對(duì)健康對(duì)照),其在預(yù)先限定的模塊框架中作圖。點(diǎn)密度(紅色,提高;藍(lán)色,降低)表明了轉(zhuǎn)錄物的豐度。圖5a和5b?;钚訲B中干擾素可誘導(dǎo)的基因表達(dá)。在來自活性TB (5a)的全血樣本中干擾素可誘導(dǎo)基因(5a)轉(zhuǎn)錄物豐度;和來自測(cè)試集血液的分離的血液白細(xì)胞群中的表達(dá)(5b)?;蜇S度/表達(dá)表示為與健康對(duì)照的中值相比(像圖I中進(jìn)行標(biāo)記)。在測(cè)試集·和分開的群中中顯示的數(shù)字對(duì)應(yīng)于個(gè)體患者。圖6a到6d。TOLl (⑶274)在活性TB患者的全血中是過多的,這主要地是由于其被嗜中性粒細(xì)胞過表達(dá)。(6a)在活性TB患者(活性的)和健康對(duì)照(對(duì)照)(或潛伏性的南非)中TOLl的豐度(相對(duì)于所有樣本的中值進(jìn)行歸一化)。還顯示了在來自代表性患者和對(duì)照的全血白血球中I3DLl的幾何平均熒光強(qiáng)度(MFI)。MFI水平與TOLl的表達(dá)譜通過箭頭連接。圖像顯示了,從11 11名活性TB患者和11名健康對(duì)照中得到的合并的MFI數(shù)據(jù)(誤差線=平均值±95%CI)。(6b)不同細(xì)胞亞群的TOLl的MFI (藍(lán)色),與總白細(xì)胞(紅色)和總細(xì)胞的同種型對(duì)照(緑色)進(jìn)行比較。顯示了對(duì)照和患者。圖像顯示了,從相同數(shù)量的活性TB患者和健康對(duì)照中得到的合并的MFI數(shù)據(jù)(誤差線=平均值±95%CI)。(6c)顯示了在富集的細(xì)胞亞群中4名對(duì)照和7名活性TB患者的TOLl表達(dá),所述的PDL表達(dá)相對(duì)于所有的樣本中值進(jìn)行歸ー化。(6d)在7名活性TB患者(活性的)的全血中的I3DLl豐度在抗分枝桿菌治療后0、2和12個(gè)月時(shí)顯示,其與試驗(yàn)集中的12名健康對(duì)照(對(duì)照)進(jìn)行比較。圖7a到7c。訓(xùn)練、試驗(yàn)和驗(yàn)證集的形成。各個(gè)隊(duì)列不僅是獨(dú)立招募而,而且RNA加工和微陣列分析的所有階段也都是完全獨(dú)立地進(jìn)行的。(7a)訓(xùn)練集隊(duì)列在倫敦,UK的招募;(7b)獨(dú)立的試驗(yàn)集隊(duì)列在倫敦,UK的招募;(7c)獨(dú)立的驗(yàn)證集隊(duì)列在南非,開普敦的招募。圖8a到8d?;颊邎D譜的分層聚類。(8a)將訓(xùn)練集的1836種轉(zhuǎn)錄物表達(dá)譜通過Spearman相關(guān)進(jìn)行無人監(jiān)瞀的分層聚類,所述Spearman相關(guān)以其平均距離產(chǎn)生條件樹(沿著熱カ圖的上邊緣)。這些患者聚類可以與臨床和人ロ統(tǒng)計(jì)參數(shù)進(jìn)行比較,所述參數(shù)顯示在位于沿著熱カ圖的下邊緣的每個(gè)圖譜下方的塊中。在圖的底部提供了關(guān)鍵詞。根據(jù)距離均勻劃分聚類。(8b)通過Pearson相關(guān)性使用平均距離對(duì)測(cè)試集的393個(gè)轉(zhuǎn)錄物表達(dá)圖譜進(jìn)行聚類。(8c)根據(jù)Pearson相關(guān)性使用平均距離對(duì)驗(yàn)證集的393個(gè)轉(zhuǎn)錄物表達(dá)圖譜進(jìn)行聚類。(8d和8e)在驗(yàn)證集中僅22到34歲的393個(gè)轉(zhuǎn)錄物患者表達(dá)譜。圖9a到9c。活性TB的轉(zhuǎn)錄簽名和疾病的放射照相程度的比較。(9a)用于根據(jù)疾病的程度將胸部放射照片進(jìn)行分級(jí)的分類方案。(9b)訓(xùn)練集中全部13名活性TB患者的393個(gè)轉(zhuǎn)錄物表達(dá)譜,以及在診斷時(shí)拍攝的相對(duì)應(yīng)的胸部放射照片,兩者均根據(jù)按照所述分類方案的X-射線分級(jí)法進(jìn)行分組。對(duì)于給定的患者,表達(dá)譜和放射照片給予相同的數(shù)字指示符號(hào)。(9c)試驗(yàn)集中全部21名活性TB患者的393個(gè)轉(zhuǎn)錄物表達(dá)譜和胸部放射照片。圖IOa到10d?;钚訲B的全血轉(zhuǎn)錄簽名反映了細(xì)胞組成中的獨(dú)特變化以及基因表達(dá)絕對(duì)水平的變化。在預(yù)先設(shè)定的模塊框架中將活性TB的基因表達(dá)相對(duì)于健康對(duì)照進(jìn)行作圖。點(diǎn)的密度代表了對(duì)于各個(gè)模塊,顯著差異表達(dá)的轉(zhuǎn)錄物的比例(紅色=提高的,藍(lán)色=降低的,轉(zhuǎn)錄豐度)。此前通過無偏向的文獻(xiàn)分析來確定的功能判讀通過在主圖4顔色代碼化的網(wǎng)格指示。在此證實(shí)了在訓(xùn)練集(IOa)中,提高(紅色)或者降低(藍(lán)色)的各個(gè)模塊中的基因的百分比;(IOb)測(cè)試集;(IOc)驗(yàn)證集(SA)。(IOd)對(duì)各個(gè)患者在基線預(yù)治療(O個(gè)月)和開始抗分枝桿菌治療后的第2個(gè)月和第12個(gè)月,計(jì)算了健康的加權(quán)分子距離。個(gè)體患者的編號(hào)對(duì)應(yīng)于圖3a到3d中所顯示的那些。
圖Ila到11c?;钚訲B患者和対照的血液中淋巴細(xì)胞的分析。(Ila)顯示了用于從試驗(yàn)集的健康對(duì)照和活性TB患者的全血中分析T細(xì)胞和B細(xì)胞的流式細(xì)胞法選擇通過策略。面板頂部的列顯示了用于確定在隨后的選擇通過中使用的淋巴細(xì)胞FSC/SSC選擇通過的后部選擇通過策略。最初設(shè)置了大的FSC/SSC選擇通過(左側(cè)的面板)和隨后分析CD45vs⑶3。選擇通過了⑶45⑶3 (中間面板)并測(cè)定的它們的FSC/SSC圖譜(右側(cè)的面板)。該圖譜隨后用于確定合適的淋巴細(xì)胞FSC/SSC選擇通過(參見第二行,左側(cè)的面板)。這ー后部選擇通過程序也在CD45+CD19+(B細(xì)胞)的選擇通過中進(jìn)行,從而確保這些細(xì)胞被包括在淋巴細(xì)胞選擇通過中(未顯示)。面板的第二行顯示了用于識(shí)別T細(xì)胞群的選擇通過策略。設(shè)置了淋巴細(xì)胞FSC/SSC的選擇通過,并且評(píng)估這些細(xì)胞的⑶45 vs.⑶3 (從左第二個(gè)面板)。隨后選擇通過⑶45+細(xì)胞,并且評(píng)估⑶3 vs⑶8。選擇通過⑶3+T細(xì)胞,并且評(píng)估⑶4和⑶8的表達(dá)。隨后選擇通過⑶4+和⑶8+的亞集。第3-6行顯示了用于限定T細(xì)胞記憶亞集的選擇通過策略。評(píng)估在第2行中選擇通過的⑶4和⑶8T細(xì)胞的⑶45RA vs CCR7的表達(dá),以及基于同種型対照的四分之一集(第5和6行)來定義原態(tài)的(⑶45RA+CCR7+)、中央記憶(CD45RA-CCR7+)、效應(yīng)子記憶(CD45RA—CCR7-),以及在CD8+T細(xì)胞的情況下,最終分化的效應(yīng)(⑶45RA+CCR7_)T細(xì)胞。也評(píng)價(jià)了這些亞集的⑶62L的表達(dá)。面板底部的行顯示了用于選擇通過B細(xì)胞的策略。設(shè)置了淋巴細(xì)胞FSC/SSC的選擇通過,并且評(píng)價(jià)了細(xì)胞的⑶45 vs⑶19。選擇通過了細(xì)胞⑶45+,并且評(píng)價(jià)了⑶19和⑶20。B細(xì)胞定義為CD19+CD20+。(Ilb)為了得到T細(xì)胞記憶群,來自11名測(cè)試集的健康對(duì)照(對(duì)照)和9名測(cè)試集活性TB患者(活性的)的全血通過多參數(shù)流式細(xì)胞法分析。圖Ila中顯示了完整的流式細(xì)胞選擇通過策略。曲線圖顯示了所有的個(gè)體的原態(tài)、中間記憶(TCM)、效應(yīng)子記憶(TEM)和最終分化效應(yīng)子(TD,僅⑶8+T細(xì)胞)細(xì)胞亞集的百分比(頂部的行,各個(gè)組中),以及各個(gè)細(xì)胞亞集中的細(xì)胞數(shù)量(XlO6Ail)(底部的行,各個(gè)組)。各個(gè)符號(hào)代表了個(gè)體患者。水平線代表了中值。(Ilc)基因(i)在來自活性TB (訓(xùn)練、測(cè)試和驗(yàn)證集)的全血樣本中的T細(xì)胞轉(zhuǎn)錄物豐度;
(ii)在來自測(cè)試集血液中的分離的血液淋巴細(xì)胞群中的表達(dá)。基因豐度/表達(dá)是以與健康對(duì)照的中值(如圖I中所標(biāo)出的)進(jìn)行對(duì)比顯示的。在試驗(yàn)集中顯示的數(shù)字和分開的群對(duì)應(yīng)于個(gè)體患者。圖12a到12c?;钚訲B患者和対照的血液中髓樣細(xì)胞的分析。(12a)顯示了用于從測(cè)試集的健康對(duì)照和活性的TB患者的全血中分析單核細(xì)胞和嗜中性粒細(xì)胞的流式細(xì)胞選擇通過策略。設(shè)置了大FSC/SSC選擇通過(頂部的行,左側(cè)的面板),隨后分析⑶45 vs⑶14。選擇通過了細(xì)胞⑶45+ (中間的面板),并且評(píng)價(jià)⑶14 vs⑶16。單核細(xì)胞定義為⑶14+,炎癥單核細(xì)胞定義為⑶14+⑶16+,并且嗜中性粒細(xì)胞定義為⑶16+。在圖中還顯示了用于評(píng)估⑶16+嗜中性粒細(xì)胞和表達(dá)⑶16的NK細(xì)胞之間可能重疊的選擇通過策略。設(shè)置了大的FSC/SSC選擇通過,從而通過嗜中性粒細(xì)胞和NK細(xì)胞兩者。(12b)隨后評(píng)估了⑶45+細(xì)胞的⑶16 vs⑶56 (NK細(xì)胞標(biāo)物)。⑶16+嗜中性粒細(xì)胞表達(dá)高水平的⑶16而非⑶56 (如同種型對(duì)照作圖,底部的面板所顯示的)。⑶56+NK細(xì)胞表達(dá)中等水平的⑶16,并且不和⑶16hi細(xì)胞重疊。⑶56+CD16int細(xì)胞和⑶16hi細(xì)胞具有不同的FSC/SSC特征。(12c)髓樣基因(i)在來自活性TB患者(訓(xùn)練、測(cè)試和驗(yàn)證集)的全血樣本中的轉(zhuǎn)錄物豐度;以及(^)在來自測(cè)試集血液的分離的血液淋巴細(xì)胞群中的表達(dá)?;蜇S度/表達(dá)是以健康對(duì)照的中值比較來顯示的(如圖I中所標(biāo)記的)。在試驗(yàn)集中顯示的數(shù)字和分開的群對(duì)應(yīng)于個(gè)體患者。圖13a和13b。393個(gè)轉(zhuǎn)錄物簽名的Ingenuity Pathways分析。(13a)各個(gè)典型生物途徑顯著地過表達(dá)的可能性(按照Fischer精確檢驗(yàn)計(jì)算的p_值的對(duì)數(shù),進(jìn)行了Benjamini-Hochberg多重測(cè)試矯正)是由橙色的方塊指示的。實(shí)心的有色條代表了包含存在于分析的基因列表中的途徑(以粗體在各個(gè)條的右側(cè)邊緣給出)的基因總數(shù)的百分比。條的顏色指示了那些在訓(xùn)練集的活性TB患者以及與此相比健康対照的全血中轉(zhuǎn)錄物的豐 度。(13b)在此顯示了 12名健康對(duì)照和13名具有活性TB的患者的干擾素a _2a(IFN_a 2a)和干擾素Y (IFN-Y)的血清水平,所述的健康對(duì)照和患者用于訓(xùn)練集微陣列分析。對(duì)于任ー細(xì)胞因子,使用雙側(cè)Mann-Whitney檢驗(yàn)在各組之間未觀察到顯著性差異。水平線指示了各組的平均值,以及側(cè)線指示了 95%的置信區(qū)間。圖14a和14b。來自個(gè)體的健康對(duì)照和具有活性TB的患者的全血和細(xì)胞亞群中PDLl (⑶274)的表達(dá)。(14a)通過流式細(xì)胞法來分析來自11名測(cè)試集健康對(duì)照(對(duì)照)和11名測(cè)試集活性TB患者(活性的)的全血中的I3DLl的表達(dá)。設(shè)置了大的FSC/SSC選擇通過,從而通過全部的白細(xì)胞,并且TOLl的幾何平均熒光強(qiáng)度(MFI)(用紅色表示)與所評(píng)估的同種型對(duì)照(緑色)進(jìn)行比較。將各個(gè)活性TB患者在不同日進(jìn)行分析,健康對(duì)照按小組(從左邊開始,樣本I和2,3和4,6-8以及9-11 一起運(yùn)行,5單獨(dú)運(yùn)行)進(jìn)行分析并且各組中的樣本公用ー個(gè)同種型對(duì)照。(14b)在a部分中,來自相同的11名測(cè)試集健康對(duì)照(對(duì)照)和11名試驗(yàn)集活性TB患者(活性的)的血液的細(xì)胞亞群也通過流式細(xì)胞法分析I3DLl的表達(dá)。細(xì)胞亞群如圖6b中所限定的,并且將TOLl的MFI (紅色)與作圖的同種型對(duì)照(緑色)進(jìn)行比較。圖15a_f。放大顯示了訓(xùn)練集的393個(gè)轉(zhuǎn)錄譜,在圖的右部列出了基因符號(hào),所述的轉(zhuǎn)錄譜根據(jù)研究組進(jìn)行排序。關(guān)鍵的轉(zhuǎn)錄物用更大的字突出顯示。在各個(gè)圖的左部顯示了整個(gè)的基因樹及熱力圖以及黑色長方形標(biāo)記的放大的區(qū)域。轉(zhuǎn)錄物的相對(duì)豐度在圖的底部以顏色尺度指示(如圖I所示的)。圖16a到16是比較了對(duì)照、潛伏性的和活性的多種基因的熱カ圖,所述的基因列于熱カ圖的右手側(cè)。圖17a到17c是在表中所列出的多個(gè)訓(xùn)練集、測(cè)試集和驗(yàn)證集的統(tǒng)計(jì)結(jié)果的表,SP性別ヽ來源國家和對(duì)于多種斷裂的種族レヒ^^^セ又)。圖18a到18c是在表中所列出的多個(gè)訓(xùn)練集、測(cè)試集和驗(yàn)證集的統(tǒng)計(jì)結(jié)果的表格,即TST、BCG接種和剪切狀態(tài)的測(cè)試結(jié)果
圖19是總結(jié)了樣本的多種來源之間的訓(xùn)練集、測(cè)試集和驗(yàn)證集的特異性和靈敏度結(jié)果的表格。發(fā)明描述盡管在下文詳細(xì)地討論了本發(fā)明不同實(shí)施方案的制備和應(yīng)用,應(yīng)該理解本發(fā)明提供了多種可實(shí)施的發(fā)明構(gòu)思,所述構(gòu)思能夠在多種具體的環(huán)境下體現(xiàn)。在此討論的具體實(shí)施方案僅僅為了說明產(chǎn)生和應(yīng)用本發(fā)明的具體方式,而不限制本發(fā)明的范圍。為了便于理解本發(fā)明,以下定義了多個(gè)術(shù)語。在此定義的術(shù)語具有本發(fā)明相關(guān)領(lǐng)域的普通技術(shù)人員通常所理解的含義。術(shù)語如“ー個(gè)(a/an)”、“ー種(a/an)”和“該”不意圖僅指單數(shù)的實(shí)體,而包括一般的類,該類中具體的實(shí)例可能使用作為說明。本文使用的該術(shù)語用于描述本發(fā)明的具體實(shí)施方案,然而其使用不限制本發(fā)明,除非在權(quán)利要求中指出。除非另外限定,本文使用的所有技術(shù)及科學(xué)術(shù)語具有本發(fā)明所屬領(lǐng)域的技術(shù)人員所一般地理解的含義。隨后的參考文獻(xiàn)為技術(shù)人員提供了在本發(fā)明中所使用的多個(gè)術(shù)語的一般定義Singleton等人,Dictionary of Microbiology and Molecular Biology(2d ed. 1994);The·Cambridge Dictionary of Science and Technology(Walker ed. , 1988);The Glossary ofGenetics, 5TH ED. , R. Rieger 等人(eds.), Springer Verlag (1991);以及 Hale&Marham, TheHarper Collins Dictionary of Biology (1991)。在本領(lǐng)域中不同的生物化學(xué)和分子生物學(xué)方法是公知的。例如,分離和純化核酸的方法詳細(xì)描述于WO 97/10365 ;W0 97/27317 ;Laboratory Techniques in Biochemistryand Molecular Biology!Hybridization with Nucleic Acid Probes,Part I. Theoryand Nucleic Acid Preparation, (P. Tij ssen, ed. ) Elsevier, N. Y. (1993)的第三章;Sambrook等人,Molecular Cloning:A Laboratory Manual, Cold Spring Harbor Press, N.Y. , (1989);以及 Current Protocols in Molecular Biology, (Ausubel, F. M 等人,eds.)John ffiley&Sons, Inc. , New York (1987-1999),包括附錄。生物信息學(xué)定義如本文所使用的,“對(duì)象”指任意目標(biāo)項(xiàng)目或者信息(通常是文本的,包括名詞、動(dòng)詞、形容詞、副詞、短語、句子、符號(hào)、數(shù)字符號(hào)等等)。因此,對(duì)象是能夠構(gòu)成關(guān)系的任何事物,以及能夠獲得、鑒定和/或從源中捜索的任何事物?!皩?duì)象”包括但不限于目標(biāo)實(shí)體,如基因,蛋白質(zhì),疾病,顯型,機(jī)理,藥物等等。在ー些方面中,如下文進(jìn)ー步所描述地,對(duì)象可能為數(shù)據(jù)。如本文所使用的,“關(guān)系”指在同一単元(如短語、句子、文本的兩行或更多行、段落、網(wǎng)頁的部分、頁面、雜志、論文、書籍等等)中共同出現(xiàn)的對(duì)象。其可能為文本、符號(hào)、數(shù)字及其組合。如本文所使用的,“元數(shù)據(jù)內(nèi)容”指根據(jù)數(shù)據(jù)源中的文本組織的信息。元數(shù)據(jù)可能包括標(biāo)準(zhǔn)的元數(shù)據(jù)(如都柏林核心元數(shù)據(jù))或者可能是標(biāo)本特異的。元數(shù)據(jù)格式的實(shí)例包括但不限于,用于圖書館目錄的機(jī)器可讀目錄(MARC)記錄,源描述格式(RDF)以及可擴(kuò)展標(biāo)記語言(XML)。元對(duì)象可能人工產(chǎn)生或者通過自動(dòng)化的信息提取運(yùn)算法則產(chǎn)生。如本文所使用的,“引擎”指實(shí)施其他程序的核心或關(guān)鍵功能的程序。例如引擎可以為操作系統(tǒng)或者應(yīng)用程序中的中心程序,其調(diào)節(jié)其他程序的全部操作。術(shù)語“引擎”還可能指包括可以改變的運(yùn)算法則的程序。例如可以設(shè)計(jì)知識(shí)發(fā)掘引擎,從而其確定關(guān)系的方式可能變化,從而反映確定和排序關(guān)系的新規(guī)則。如本文所使用的,“語義分析”指表示相似概念的詞之間的關(guān)系的確定,如通過去除后綴或者添加部分或者通過采用同義詞詞典?!敖y(tǒng)計(jì)分析”指基于計(jì)算各項(xiàng)目(詞、詞根、詞干、元語法、短語等等)發(fā)生數(shù)量的技木。在不限定對(duì)象的集中,用于不同的上下文的相同 短語可能代表不同的概念。對(duì)短語共同出現(xiàn)的統(tǒng)計(jì)分析可能幫助分析語義含糊。“語法分析(Syntactic analysis)”可以用于通過詞類分析進(jìn)ー步地減少模糊。如本文使用的,更一般地將ー種或多種該分析稱作“語法分析(lexical analysis)”?!叭斯ぶ悄?Al)”指某些方法,通過該方法,非人的設(shè)備如計(jì)算機(jī)實(shí)施人認(rèn)為值得注意的或者“智能的”任務(wù)。實(shí)例包括鑒定圖片,理解ロ語詞匯或者書寫的文字,以及解決問題。術(shù)語如“數(shù)掘”、“數(shù)據(jù)集”及“信息”通??山粨Q地與使用,“信息”和“知識(shí)”也是如此。如本文所使用的,“數(shù)據(jù)”是最基礎(chǔ)的単元,其為依據(jù)試驗(yàn)的測(cè)量或測(cè)量的集。收集數(shù)據(jù)以構(gòu)成信息,但是它基本上獨(dú)立于此,且可以組合成數(shù)據(jù)集,即數(shù)據(jù)的集。于此相對(duì),信息得自目標(biāo),如數(shù)據(jù)(単元)可能在種族、性別、身高、體重及飲食方面收集,用于發(fā)現(xiàn)與心血管疾病風(fēng)險(xiǎn)有關(guān)的變量的目的。然而,相同的數(shù)據(jù)可能用于開發(fā)食譜或者產(chǎn)生關(guān)于飲食偏好的“信息”,所謂飲食偏好即這樣的可能性,在超級(jí)市場(chǎng)中特定的產(chǎn)品具有更高的銷售可能性。如本文所使用的,術(shù)語“數(shù)據(jù)庫”是原始的或者收集的數(shù)據(jù)的儲(chǔ)存庫,甚至在數(shù)據(jù)領(lǐng)域中能找到不同的信息方面。數(shù)據(jù)庫可能包括一個(gè)或多個(gè)數(shù)據(jù)集。一般地將數(shù)據(jù)庫進(jìn)行組織從而能訪問、管理并更新(例如,該數(shù)據(jù)庫是動(dòng)態(tài)的)其內(nèi)容。術(shù)語“數(shù)據(jù)庫”及“源”也能在本發(fā)明中交換地使用,這是由于數(shù)據(jù)和信息的原始來源是數(shù)據(jù)庫。然而“源數(shù)據(jù)庫”或者“源數(shù)據(jù)” 一般地指數(shù)據(jù),例如,輸入到系統(tǒng)中用于鑒定對(duì)象及確定關(guān)系的無結(jié)構(gòu)的文本和/或有結(jié)構(gòu)的數(shù)據(jù)。源數(shù)據(jù)庫可能是或者可能不是關(guān)系數(shù)據(jù)庫。然而,系統(tǒng)數(shù)據(jù)庫通常包括關(guān)系數(shù)據(jù)庫或者某種等效類型的數(shù)據(jù)庫,其儲(chǔ)存對(duì)象之間的關(guān)系的相關(guān)數(shù)值。如本文所使用的,“系統(tǒng)數(shù)據(jù)庫”及“關(guān)系數(shù)據(jù)庫”可替換地使用,并指數(shù)據(jù)的ー個(gè)或多個(gè)集,所述集組織為包括數(shù)據(jù)的ー套表格,其中的數(shù)據(jù)組合于預(yù)先設(shè)定的種類。例如,數(shù)據(jù)庫表可能包括列(例如,屬性)所設(shè)定的ー個(gè)或多個(gè)種類,而數(shù)據(jù)庫的行可能包括對(duì)于列所設(shè)定的種類而言獨(dú)特的對(duì)象。因此,對(duì)象如基因的性質(zhì)可能具有其存在、缺失、和/或該基因表達(dá)水平的列。關(guān)系數(shù)據(jù)庫的一行可能也指“ー個(gè)集”,并通常地通過其各列的數(shù)值定義。關(guān)系數(shù)據(jù)庫的情況中的“域”是ー系列有效的數(shù)值,例如列可能包括的領(lǐng)域。如本文所使用的,“知識(shí)域”指研究的領(lǐng)域,在該領(lǐng)域中系統(tǒng)是可操作的,例如,所有的生物醫(yī)學(xué)數(shù)據(jù)。應(yīng)該指出從幾個(gè)域中合并數(shù)據(jù)是有益的,例如,生物醫(yī)學(xué)數(shù)據(jù)及工程數(shù)據(jù),這是由于不同的數(shù)據(jù)有時(shí)候能將對(duì)于只熟悉ー個(gè)領(lǐng)域或者探索/研究(ー個(gè)域)的平常人無法放在一起的事物進(jìn)行聯(lián)系?!胺植嫉臄?shù)據(jù)庫”指可能在網(wǎng)絡(luò)上不同點(diǎn)中分布或者復(fù)制的數(shù)據(jù)庫。如本文所使用的,“信息”指數(shù)據(jù)集,其可能包括數(shù)字、字母、數(shù)字的集合、字母的集合或由數(shù)據(jù)的集合導(dǎo)致或者得到的結(jié)論。“數(shù)據(jù)”則為測(cè)量或者統(tǒng)計(jì)量,并且為信息的基本単元?!靶畔ⅰ笨赡苓€包括其他類型的數(shù)據(jù),如詞語、符號(hào)、文字,如無結(jié)構(gòu)的自由的文字、編碼等等?!爸R(shí)”被松散地定義為信息的集合,其提供對(duì)于系統(tǒng)的充分的理解,從而為原因和效果進(jìn)行建摸。為了延伸前述的實(shí)例,對(duì)于人口特征、性別和此前的購買的信息可以用于發(fā)展用于食物銷售的區(qū)域市場(chǎng)戰(zhàn)略,而關(guān)于國籍的信息可能由購買者用作產(chǎn)品進(jìn)ロ的指導(dǎo)方針。重要的是,需指出在數(shù)據(jù)、信息和知識(shí)之間沒有嚴(yán)格的界限;這三種術(shù)語有時(shí)認(rèn)為是等價(jià)的。一般地,數(shù)據(jù)來自測(cè)試,信息來自關(guān)聯(lián),而知識(shí)來自建模。如本文所使用的,“程序”或者“計(jì)算機(jī)程序” 一般地指句法單元,其符合特定的編程語言的規(guī)則并包括聲明文件和陳述或者說明,可分成“代碼段”,其被需要用于解決或者執(zhí)行特定的功能、任務(wù)以及問題。編程語言一般地是用于表達(dá)程序的人工語言。如本文所使用的,“系統(tǒng)”或者“計(jì)算機(jī)系統(tǒng)” 一般地指一臺(tái)或多臺(tái)計(jì)算機(jī),外部設(shè)備以及進(jìn)行數(shù)據(jù)處理的軟件?!坝脩簟被蛘摺跋到y(tǒng)操作者”一般地包括通過“用戶設(shè)備”(如計(jì)算機(jī),無線設(shè)備等),為了數(shù)據(jù)處理和信息交換而使用計(jì)算機(jī)網(wǎng)絡(luò)的人。“計(jì)算機(jī)”一般地是能夠進(jìn)行實(shí)質(zhì)上的計(jì)算的功能性單元,其包括無人為干涉下的多種算術(shù)運(yùn)算和邏輯操作。如本文所使用的,“應(yīng)用軟件”或者“應(yīng)用程序”一般地指對(duì)于應(yīng)用問題的解決特異性的軟件或者程序?!皯?yīng)用問題” 一般地是由終端用戶提交,其解決需要信息處理。 如本文所使用的,“自然語言”指其規(guī)則基于現(xiàn)有的使用而不特別地規(guī)定的語言,如英語、西班牙語或者中文。如在此所使用的,“人工語言”指其規(guī)則在其使用前明確地建立的語言,如計(jì)算機(jī)編程語言,諸如C、C++、JAVA、BASIC、FORTRAN或者COBOL。如本文所使用的,“統(tǒng)計(jì)關(guān)聯(lián)性”指使用一種或者多種排序方案(0/E比率、強(qiáng)度等等),其中如果比隨機(jī)幾率預(yù)期其發(fā)生顯著地更加頻繁,則確定關(guān)系是統(tǒng)計(jì)相關(guān)的。如本文所使用的,術(shù)語“共同調(diào)節(jié)的基因”或者“轉(zhuǎn)錄模塊”可交換地使用,指特定基因的成組的基因表達(dá)譜(如與特定的基因序列相關(guān)的信號(hào)數(shù)值)。各個(gè)轉(zhuǎn)錄模塊在兩部分關(guān)鍵的數(shù)據(jù)之間建立聯(lián)系,即文獻(xiàn)檢索部分和得自基因微陣列的實(shí)際試驗(yàn)的基因表達(dá)數(shù)值數(shù)據(jù)。選入轉(zhuǎn)錄模塊的基因集基于對(duì)基因表達(dá)數(shù)據(jù)的分析(前述的模塊選取運(yùn)算法則)。不教了此外的步驟的有 Chaussabel, D. &Sher, A. Mining microarray expression data byliterature profiling. Genome Biol 3, RESEARCH0055 (2002), (http://genomebiology.com/2002/3/10/research/0055)相關(guān)的部分在此引入作為參考以及得自感興趣的疾病或者癥狀的表達(dá)數(shù)據(jù),所述疾病或者癥狀如系統(tǒng)性紅斑狼瘡、關(guān)節(jié)炎,淋巴瘤,癌,黑色素瘤,急性感染,自身免疫性疾病,自身炎癥性疾病等)。下表中列出了用于得到文獻(xiàn)檢索部分或者對(duì)轉(zhuǎn)錄模塊有貢獻(xiàn)的關(guān)鍵詞的實(shí)例。技術(shù)人員應(yīng)意識(shí)到在其他情況下能容易地選擇其他術(shù)語,如具體的癌癥、具體的感染性疾病、移植等等。例如,與T細(xì)胞活化有關(guān)的那些基因的基因和信號(hào)以“M 2. 8”的模塊ID描述于下文,其中特定的關(guān)鍵詞(如淋巴瘤、T-細(xì)胞、CD4、CD8、TCR、胸腺、淋巴、IL2 )用于確定關(guān)鍵的T-細(xì)胞相關(guān)的基因,如T-細(xì)胞表面標(biāo)記物(⑶5、⑶6、⑶7、⑶26、⑶28、⑶96 );由淋巴譜系細(xì)胞表達(dá)的分子(淋巴毒素β、IL2誘導(dǎo)的T細(xì)胞激酶、TCF7 ;以及T細(xì)胞分化蛋白mal、GATA3、STAT5B)。隨后,整個(gè)模塊通過將來自患者群體的這些基因的數(shù)據(jù)建立聯(lián)系(不管平臺(tái)、存在/缺失和/或上調(diào)或者下調(diào))從而產(chǎn)生轉(zhuǎn)錄模塊。在一些情況下,基因表達(dá)譜并不匹配(在此時(shí))這些疾病癥狀的任何具體的基因簇和數(shù)據(jù),然而在“未確定的”模塊中發(fā)現(xiàn)了特定的生理通路(例如cAMP信號(hào)轉(zhuǎn)導(dǎo)、鋅指蛋白、細(xì)胞表面標(biāo)記物等等)。實(shí)際上,基因表達(dá)數(shù)據(jù)集可能用于在與關(guān)鍵詞檢索匹配之前,提取具有協(xié)調(diào)的表達(dá)的基因,即任意數(shù)據(jù)集可能在與第二個(gè)數(shù)據(jù)集交叉引用之前相互關(guān)聯(lián)。表I.轉(zhuǎn)錄模塊
權(quán)利要求
1.ー種用于檢測(cè)表現(xiàn)為潛伏性的/無癥狀的活性結(jié)核分枝桿菌感染的方法,所述的方法包括 從懷疑感染了潛伏性的/無癥狀的結(jié)核分枝桿菌的患者獲得患者的基因表達(dá)數(shù)據(jù)集; 將該患者的基因表達(dá)數(shù)據(jù)集分成與結(jié)核分枝桿菌感染相關(guān)的ー個(gè)或多個(gè)基因模塊;并且 將ー個(gè)或多個(gè)基因模塊中的每ー個(gè)的患者的基因表達(dá)數(shù)據(jù)集與來自也分類為相同基因模塊的非患者的基因表達(dá)數(shù)據(jù)集相比;其中在ー個(gè)或多個(gè)基因模塊的患者的基因表達(dá)數(shù)據(jù)集中,基因表達(dá)的整體上升或者下降指示了活性的結(jié)核分枝桿菌感染而不是潛伏性的/無癥狀的結(jié)核分枝桿菌感染。
2.權(quán)利要求I所述的方法,其還包括使用測(cè)定的比較基因產(chǎn)物信息來制定至少ー種診斷、預(yù)后或者治療方案的步驟。
3.權(quán)利要求I所述的方法,其還包括將具有潛伏性TB的患者與活性TB患者區(qū)分的步驟。
4.權(quán)利要求I所述的方法,其中患者的基因表達(dá)數(shù)據(jù)集得自從全血、外周血液?jiǎn)魏思?xì)胞或者唾液的至少ー種中獲得的細(xì)胞。
5.權(quán)利要求I所述的方法,其中將患者基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200、250、300、350或者393個(gè)選自表2中基因的基因進(jìn)行比較。
6.權(quán)利要求I所述的方法,其中將患者基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3, M2. 8、Ml. 5, M2. 6, M2. 2 和 M3. I 進(jìn)行比較。
7.權(quán)利要求I所述的方法,其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。
8.權(quán)利要求I所述的方法,其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)的基因中上升,在T細(xì)胞相關(guān)的基因中下降,在骨髓相關(guān)的基因中上升,在嗜中性粒細(xì)胞相關(guān)的轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中上升。
9.權(quán)利要求I所述的方法,其中患者的疾病狀態(tài)進(jìn)ー步通過患者肺部的放射學(xué)分析來測(cè)定。
10.權(quán)利要求I所述的方法,其還包括在治療患者后測(cè)定經(jīng)治療的患者基因表達(dá)數(shù)據(jù)集,并且測(cè)定經(jīng)治療的患者基因表達(dá)數(shù)據(jù)集是否已經(jīng)恢復(fù)到正常的基因表達(dá)數(shù)據(jù)集,從而確定該患者是否已經(jīng)被治療的步驟。
11.ー種用于預(yù)測(cè)表現(xiàn)為潛伏性的/無癥狀的結(jié)核分枝桿菌感染是否將會(huì)變?yōu)榛钚越Y(jié)核分枝桿菌感染的方法,該方法包括 從得自具有活性的結(jié)核分枝桿菌感染的第一臨床組中獲得第一基因表達(dá)數(shù)據(jù)集,從得自具有潛伏性的結(jié)核分枝桿菌感染患者的第二臨床組中獲得第二基因表達(dá)數(shù)據(jù)集,以及從得自未感染個(gè)體的臨床組中獲得第三基因表達(dá)數(shù)據(jù)集; 產(chǎn)生基因簇?cái)?shù)據(jù)集,所述的基因簇?cái)?shù)據(jù)集包括在第一、第二和第三數(shù)據(jù)集的任意兩者之間基因的差異表達(dá);并且 確定指示了潛伏性感染、活性感染或者健康的獨(dú)特表達(dá)/代表性模式,其中所述的患者基因表達(dá)數(shù)據(jù)集包括從模塊Ml. 3,M2. 8、M I. 5,M2. 6,M2. 2和M3. I的至少ー個(gè)中的基因中獲得的至少6、10、20、40、50、70、80、90、100、125、150或200個(gè)基因,其中在ー個(gè)或多個(gè)基因模塊的患者基因表達(dá)數(shù)據(jù)集中,基因表達(dá)的整體上升或者下降指示了活性的結(jié)核分枝桿菌感染而不是潛伏性的/無癥狀的結(jié)核分枝桿菌感染。
12.一種用于在懷疑感染結(jié)核分枝桿菌的患者中診斷感染的試劑盒,所述的試劑盒包括 用于從患者獲得患者基因表達(dá)數(shù)據(jù)集的基因表達(dá)檢測(cè)器,其中所表達(dá)的基因得自患者的全血;以及 能夠?qū)⒒虮磉_(dá)數(shù)據(jù)集和事先定義的與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊數(shù)據(jù)集進(jìn)行比較的處理器,并且所述的處理器區(qū)分感染的和未感染的患者,其中全血證實(shí)了與匹配的未感染患者相比,在一個(gè)或多個(gè)轉(zhuǎn)錄基因表達(dá)模塊中多核苷酸水平的總體變化,從而區(qū)分活性的/無癥狀的結(jié)核分枝桿菌感染。
13.權(quán)利要求12所述的試劑盒,其中患者的基因表達(dá)數(shù)據(jù)集得自外周血液?jiǎn)魏思?xì)胞。
14.權(quán)利要求12所述的試劑盒,其中將患者的基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200、250、300、350或者393個(gè)選自表2中基因的基因進(jìn)行比較。
15.權(quán)利要求12所述的試劑盒,其中將所述的患者基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3, M2. 8、Ml. 5, M2. 6, M2. 2 和 M3. I 進(jìn)行比較。
16.權(quán)利要求12所述的試劑盒,其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。
17.權(quán)利要求12所述的試劑盒,其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)的基因中下降,在T細(xì)胞相關(guān)的基因中下降,在骨髄相關(guān)的基因中上升,在嗜中性粒細(xì)胞相關(guān)的轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中上升。
18.權(quán)利要求12所述的試劑盒,其中所述的基因選自roL-l、CASP5、CRl、CASP5、TLR5、MAPK14、STX11、BCL6 和 C5。
19.一種檢測(cè)表現(xiàn)為潛伏性的/無癥狀的活性結(jié)核分枝桿菌感染的系統(tǒng),該系統(tǒng)包括 用于從患者獲得患者基因表達(dá)數(shù)據(jù)集的基因表達(dá)檢測(cè)器,其中所表達(dá)的基因得自患者的全血;以及 能夠?qū)⒒虮磉_(dá)數(shù)據(jù)集和事先定義的與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊數(shù)據(jù)集進(jìn)行比較的處理器,并且所述的處理器區(qū)分具有處于進(jìn)展為疾病的風(fēng)險(xiǎn)的潛伏性結(jié)核分枝桿菌感染的患者,其中全血證實(shí)了與匹配的未感染患者相比,在一個(gè)或多個(gè)轉(zhuǎn)錄基因表達(dá)模塊中多核苷酸水平的總體變化,從而區(qū)分具有處于進(jìn)展為疾病的風(fēng)險(xiǎn)的潛伏性結(jié)核分枝桿菌感染的患者,其中所述的基因模塊數(shù)據(jù)集包括模塊Ml. 3、M2. 8、Ml. 5、M2. 6、M2. 2和M3. I中的至少ー個(gè)。
20.權(quán)利要求19所述的系統(tǒng),其中將患者的基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200、250、300、350或者393個(gè)選自表2中基因的基因進(jìn)行比較。
21.權(quán)利要求19所述的系統(tǒng),其中將所述的患者基因表達(dá)數(shù)據(jù)集和至少10、20、40、50、70、80、90、100、125、150、200 個(gè)模塊 Ml. 3、M2. 8、Ml. 5, M2. 6, M2. 2 和 M3. I 進(jìn)行比較。
22.權(quán)利要求19所述的系統(tǒng),其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊選自模塊Ml. 3、模塊M2. 8、模塊Ml. 5、模塊M2. 6、模塊M2. 2和模塊3. I。
23.權(quán)利要求19所述的系統(tǒng),其中與結(jié)核分枝桿菌感染相關(guān)聯(lián)的基因模塊是根據(jù)以下變化來進(jìn)行選擇的在B-細(xì)胞相關(guān)基因中的下降,在T細(xì)胞相關(guān)基因中的下降,在骨髓相關(guān)基因中的上升,在嗜中性粒細(xì)胞相關(guān)轉(zhuǎn)錄物和干擾素誘導(dǎo)基因(IFN)中的上升。
24.權(quán)利要求19所述的系統(tǒng),其中所述的基因選自TOL-1、CASP5、CRUCASP5、TLR5、MAPK14、STX11、BCL6 和 C5。
25.一種用于在治療性試劑試驗(yàn)中監(jiān)測(cè)療效的方法,所述方法包括 從懷疑感染了結(jié)核分枝桿菌的患者獲得患者的基因表達(dá)數(shù)據(jù)集; 將該患者的基因表達(dá)數(shù)據(jù)集分成與結(jié)核分枝桿菌感染相關(guān)的ー個(gè)或多個(gè)基因模塊;并且 將該患者的基因表達(dá)數(shù)據(jù)集分成與結(jié)核分枝桿菌感染相關(guān)的ー個(gè)或多個(gè)基因模塊;并且 將ー個(gè)或多個(gè)基因模塊中的每ー個(gè)的患者的基因表達(dá)數(shù)據(jù)集與來自非患者的基因表達(dá)數(shù)據(jù)集相比; 使用所述治療性試劑治療患者;并且 測(cè)定治療性試劑是否將患者基因表達(dá)譜改變成非患者的基因表達(dá)數(shù)據(jù)集;其中在ー個(gè)或多個(gè)基因模塊的患者的基因表達(dá)數(shù)據(jù)集中,基因表達(dá)的整體上升或者下降指示了活性的結(jié)核分枝桿菌感染而不是潛伏性的/無癥狀的結(jié)核分枝桿菌感染。
全文摘要
本發(fā)明包括用于在懷疑感染了結(jié)核分枝桿菌的患者中區(qū)分活性和潛伏性的結(jié)核分枝桿菌感染的方法、系統(tǒng)和試劑盒,所述的方法包括以下步驟從懷疑感染了結(jié)核分枝桿菌的患者中得到患者基因表達(dá)數(shù)據(jù)集;將所述的患者基因數(shù)據(jù)集分類到一個(gè)或多個(gè)與結(jié)核分枝桿菌感染關(guān)聯(lián)的基因模塊;并且將一個(gè)或多個(gè)基因模塊中每一個(gè)的所述患者基因表達(dá)數(shù)據(jù)集與來自非患者的基因表達(dá)數(shù)據(jù)集進(jìn)行比較;其中一個(gè)或者多個(gè)基因模塊的患者基因表達(dá)數(shù)據(jù)集中基因表達(dá)總量的提高和降低表明了活性的結(jié)核分枝桿菌感染。
文檔編號(hào)G01N33/15GK102844444SQ201080062710
公開日2012年12月26日 申請(qǐng)日期2010年8月19日 優(yōu)先權(quán)日2009年11月30日
發(fā)明者J·F·班徹羅, D·肖薩貝爾, A·奧加拉, M·貝里, O·M·康 申請(qǐng)人:貝勒研究院, 醫(yī)學(xué)研究理事會(huì), 國家健康服務(wù)信托基金保健帝國理工學(xué)院