專利名稱:用來分析和優(yōu)化用于癌癥診斷的標(biāo)記候選物的方法和計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用來挑選、分析、及優(yōu)化可以是在建立患有癌癥的病人的預(yù)后(prognosis)時使用的候選物的生物標(biāo)記的方法。
背景技術(shù):
已知基因增殖(gene amplification)、基因缺失(gene deletion)、及基因突變(gene mutation)通過異常蛋白質(zhì)表達(dá)在異常細(xì)胞行為中具有顯著作用。關(guān)心的細(xì)胞行為的范圍包括多樣化到例如增生或分化調(diào)整的行為。因此,在基因增殖、缺失、及突變;mRNA量化;或蛋白質(zhì)表達(dá)分析中的有效探測和量化是必要的,以便有利于在復(fù)雜疾病(例如各種形式的癌癥)中的有用研究、診斷和預(yù)后工具。
有旨在基因增殖、缺失、及突變;mRNA量化;或蛋白質(zhì)表達(dá)分析中的探測和量化的多種實驗室技術(shù)。例如,這樣的技術(shù)包括Western、Northern及Southern blots;聚合酶連鎖反應(yīng)(“PCR”);酶標(biāo)記免疫分離分析(“ELISA”);及比較基因組雜交(“CGH”)技術(shù)。然而,日常利用顯微鏡法,因為它是一種有益技術(shù),允許在細(xì)胞和亞細(xì)胞水平下的快速檢查,同時能夠以較低成本便利地實施。
當(dāng)顯微鏡法是挑選的實驗室技術(shù)時,生物樣本首先必須經(jīng)受特定探測和顯露制備。一旦樣本被制備,人類專家就在定性研究中僅借助于顯微鏡、或者在定量和一般標(biāo)準(zhǔn)化研究中借助于聯(lián)接到攝像機和計算機上的顯微鏡典型地分析樣本。在某些實例中,顯微鏡可以構(gòu)造成用于完全自動分析,其中顯微鏡借助于機動載物臺和聚焦、機動物鏡轉(zhuǎn)換盤、自動光強度控制等自動化。
用于探測的樣本制備可能涉及適于顯微成像分析的不同類型的制備技術(shù),例如基于雜交和基于免疫加標(biāo)簽的制備技術(shù)。這樣的探測技術(shù)可能與適當(dāng)?shù)娘@露技術(shù)相聯(lián),例如與基于熒光和基于可見顏色反應(yīng)的技術(shù)相聯(lián)。
在雜交中(Situ Hybridization,“ISH”)和在雜交中的熒光(Fluorescent In Situ Hybridization,“FISH”),使用探測和顯露技術(shù),例如用于在遺傳信息增殖和突變分析中的探測和量化。ISH和FISH都能用于組織學(xué)的或細(xì)胞學(xué)的樣本。這些技術(shù)使用特定互補探針來識別對應(yīng)的精確序列。依據(jù)使用的技術(shù),特定探針可以包括色度(eISH)標(biāo)記或熒光(FISH)標(biāo)記,其中然后使用透射顯微鏡或熒光顯微鏡分別分析樣本。色度標(biāo)記或熒光標(biāo)記的使用取決于用戶的目標(biāo),每一種類型的標(biāo)記在特定實例中具有優(yōu)于另一種的對應(yīng)優(yōu)點。
成像和顯微鏡法技術(shù)已經(jīng)被開發(fā),以優(yōu)化和標(biāo)準(zhǔn)化色度標(biāo)記或染劑的讀數(shù),其可以用來探測和/或量化基因增殖、基因缺失、基因突變、及異常蛋白質(zhì)表達(dá),上述在分析用所挑選的適當(dāng)標(biāo)記處理的組織切面切片以強調(diào)異常細(xì)胞活動時可以是可見的,這可有助于對于諸如癌癥之類的疾病的診斷和/或預(yù)后的確定。
這樣的方法對于得到在給定組織樣本內(nèi)的目標(biāo)分子種類的定量測量是有用的,然而,如果另外的分子種類在同一組織樣本內(nèi)由另外的生物標(biāo)記強調(diào),則它們不可能是立即可感覺到的,并且存在辨別和量化這樣的特征以便更系統(tǒng)地分析組織樣本的需要,從而允許臨床醫(yī)師提供對于患有諸如癌癥之類的復(fù)雜疾病的病人的更準(zhǔn)確預(yù)后。例如,在多種類型的癌癥中,在早期診斷的少量百分比的病人仍然最終具有不幸的十年結(jié)果,如在這十年時段內(nèi)的疾病復(fù)發(fā)、轉(zhuǎn)移、或死亡。然而,在早期診斷的大多數(shù)癌癥病人具有良好的10-年預(yù)后,并且未必需要或受益于另外的主動輔助療法(例如,化學(xué)療法)。例如,當(dāng)前臨床的一致意見是,至少某些早期、結(jié)節(jié)-陰性乳腺癌病人應(yīng)該接收輔助化學(xué)療法,但目前沒有FDA-核定分析來冒險分層病人以用于更主動治療。由于大多數(shù)這些早期乳腺癌病人在手術(shù)和/或輻射療法之后長期存活而沒有進一步治療,所以對于所有這些病人推薦主動輔助療法可能是不適當(dāng)?shù)?,特別是鑒于與癌癥化學(xué)療法相關(guān)的顯著副作用。允許把在初始診斷時的早期乳腺癌病人的這些群體區(qū)分成良好和不良預(yù)后組的組成和方法有助于臨床醫(yī)師選擇適當(dāng)?shù)闹委熯^程。因而,需要用來評估乳腺癌病人(特別是早期乳腺癌病人)的預(yù)后的方法。
盡管當(dāng)前預(yù)后標(biāo)準(zhǔn)和標(biāo)記的定量視頻顯微鏡法分析在預(yù)測病人結(jié)果和選擇適當(dāng)?shù)闹委熯^程時提供某種指導(dǎo),但存在對于利用臨床視頻顯微鏡數(shù)據(jù)以提供最佳特定和靈敏癌癥預(yù)后(特別是在早期病人中)的系統(tǒng)方法的顯著需要。另外,存在對于用來辨別和評估候選標(biāo)記和其經(jīng)視頻顯微鏡法辨別的特征的方法的需要,以有助于癌癥預(yù)后的評估。
發(fā)明內(nèi)容
提供一種用來分析和/或評估適于確定癌癥病人的預(yù)后的至少一個標(biāo)記的方法和計算機程序產(chǎn)品。用來分析至少一個標(biāo)記以確定癌癥病人的預(yù)后的方法包括步驟把身體樣本(從癌癥病人取得)暴露于所述至少一個標(biāo)記;使用圖像處理系統(tǒng)從至少一個切片的取得圖像抽取至少一個可量化特征,其中所述至少一個切片從所述身體樣本制備;及把決定規(guī)則應(yīng)用于所述至少一個可量化特征,從而基于所述至少一個可量化特征與決定規(guī)則之間的關(guān)系確定癌癥病人的預(yù)后。在用來分析所述至少一個標(biāo)記的方法的某些實施例中,應(yīng)用步驟還包括把閾值應(yīng)用于所述至少一個可量化特征,從而基于所述至少一個可量化特征與閾值之間的關(guān)系確定癌癥病人的預(yù)后。在用來分析所述至少一個標(biāo)記的方法的又一個實施例中,應(yīng)用步驟還包括應(yīng)用用于所述閾值的疾病規(guī)則,疾病規(guī)則能夠建立對應(yīng)于同閾值相關(guān)的至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
用來評估至少一個標(biāo)記的方法包括把多個身體樣本暴露于所述至少一個標(biāo)記的步驟,所述多個身體樣本從對應(yīng)的多個病人取得,其中每個病人具有已知結(jié)果。該方法還包括使用圖像處理系統(tǒng)從多個切片中的每一個的取得圖像抽取至少一個可量化特征的步驟。所述多個切片可以從與每個病人相對應(yīng)的多個身體樣本制備。此外,該方法包括步驟把多個候選決定規(guī)則應(yīng)用于多個切片的每一個的至少一個可量化特征,從而為多個切片的每一個提供一個對應(yīng)候選預(yù)后;和對于至少一個可量化特征,選擇最佳決定規(guī)則,其中最佳決定規(guī)則從候選決定規(guī)則中選擇。所述最佳決定規(guī)則規(guī)定了,用于多個切片的每一個的候選預(yù)后最佳地與對于多個病人的每一個的已知結(jié)果相對應(yīng)。例如,通過確定對于候選決定規(guī)則中的每一個的特異性和靈敏性、并挑選具有最靠近所述最佳特異性和靈敏性對(1,1)的決定規(guī)則,可以挑選最佳決定規(guī)則。
本發(fā)明的方法和計算機程序產(chǎn)品的某些實施例包括評估至少一個標(biāo)記的統(tǒng)計獨立性的步驟,從而保證所述至少一個標(biāo)記能夠提供大體統(tǒng)計地獨立于至少一個互補標(biāo)記的預(yù)后。更具體地說,以上評估步驟在某些實施例中還可以包括步驟第一,把觀察結(jié)果的頻率分布與用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第一多個身體樣本的理論預(yù)后的頻率分布相比較,所述第一多個身體樣本與具有已知良好結(jié)果的病人相對應(yīng);第二,把觀察結(jié)果的頻率分布與用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第二多個身體樣本的理論預(yù)后的頻率分布相比較,所述第二多個身體樣本與具有已知不良結(jié)果的病人相對應(yīng);及最后,估計所述至少一個標(biāo)記相對于所述至少一個互補標(biāo)記的獨立性(在某些情況下,使用卡平方分析)。
根據(jù)某些實施例,用于評估的方法的應(yīng)用步驟還可以包括把多個候選閾值應(yīng)用于每個可量化特征,從而產(chǎn)生與多個候選閾值的每一個相對應(yīng)的多個候選預(yù)后,用于多個身體樣本每一個。此外,選擇步驟還可以包括從多個候選閾值中選擇最佳閾值,從而用于多個切片的每一個的候選預(yù)后最佳地與多個病人的每一個的已知結(jié)果相對應(yīng)。這樣的最佳閾值可以提供例如由計算機化圖像處理系統(tǒng)用來在標(biāo)記已經(jīng)應(yīng)用于身體樣本(如組織學(xué)切片)之后分類對于標(biāo)記的特定可量化特征確定的給定值所使用的工具。一旦分類成在最佳閾值以上或以下,所述給定值然后就可以轉(zhuǎn)換成所述應(yīng)用決定規(guī)則的結(jié)果,該結(jié)果又用來建立用于病人的預(yù)后,其中從該病人取得身體樣本。
在其它實施例中,所述應(yīng)用步驟還可以包括確定用于多個候選閾值的每一個的疾病規(guī)則,所述疾病規(guī)則能夠建立對應(yīng)于與多個候選閾值的每一個相關(guān)的至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
根據(jù)本發(fā)明的各種實施例,所述方法可以包括把多個身體樣本暴露于至少一個標(biāo)記,其中標(biāo)記可以從如下挑選色度生物標(biāo)記、SLPI、PSMB9、NDRG-1、Muc-1、phospho-p27、src、E2F1、p21ras、p53、及其組合。另外,在某些實施例中,所述方法可以包括從多個切片的每一個的取得圖像中抽取至少一個可量化特征,其中所述可量化特征是由圖像處理系統(tǒng)可探測的和可量化的。這樣的可量化特征可以包括透射率;光學(xué)密度;細(xì)胞形態(tài);細(xì)胞類型的百分比;及其組合。
以上概括的方法步驟也可以在一個或多個適當(dāng)?shù)挠嬎銠C程序產(chǎn)品中實施,該計算機程序產(chǎn)品在計算機裝置(如與適于捕獲染色組織學(xué)切片的圖像的顯微鏡法系統(tǒng)和/或圖像分析系統(tǒng)通信的計算機裝置)上是可執(zhí)行的,并且能夠完成與上述方法實施例相關(guān)的各種功能。例如,根據(jù)一個實施例,提供一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品能夠控制圖像處理系統(tǒng),以確定癌癥病人的預(yù)后,其中計算機程序包括(1)用來使用圖像處理系統(tǒng)從多個切片的每一個的取得圖像中抽取特征的可執(zhí)行部分,所述多個切片由從多個病人取得的多個身體樣本制備,其中每個病人具有已知結(jié)果,所述多個身體樣本已經(jīng)暴露于至少一個標(biāo)記;(2)用來把多個候選決定規(guī)則應(yīng)用于多個切片的每一個的特征的可執(zhí)行部分,從而提供用于候選決定規(guī)則和特征的每種可能組合的候選預(yù)后;及(3)用來選擇與最佳預(yù)后相對應(yīng)的最佳決定規(guī)則的可執(zhí)行部分,所述最佳決定規(guī)則從所述多個候選決定規(guī)則中選擇,對于所述特征,最佳決定規(guī)則規(guī)定了用于多個切片的每一個的最佳預(yù)后最佳地與用于病人中每一個的已知結(jié)果相對應(yīng)。
因而,所述最佳決定規(guī)則可以基于多個病人的已知結(jié)果,提供基于至少一個標(biāo)記的綜合分析的預(yù)后,該標(biāo)記具有至少一個可量化特征,從而所述預(yù)后當(dāng)與多個病人的已知結(jié)果相比較時,提供最小數(shù)量的虛假肯定預(yù)后和虛假否定預(yù)后。因而,一旦被選中,所述最佳決定規(guī)則可以用來優(yōu)化一個或多個色度標(biāo)記的分析,該色度標(biāo)記具有可量化(通過例如圖像處理系統(tǒng)中的分析)的一個或多個特征,從而提供可以更準(zhǔn)確地預(yù)測良好或不良結(jié)果的病人預(yù)后。因而,本發(fā)明的方法和計算機程序產(chǎn)品可以允許臨床醫(yī)師更好地利用給定標(biāo)記(或標(biāo)記組),以便即使在僅呈現(xiàn)特定疾病的早期表現(xiàn)的病人中也預(yù)測不良結(jié)果的發(fā)生。
已經(jīng)如此概括地描述了本發(fā)明,現(xiàn)在將參照附圖,附圖不必按比例畫出,并且在附圖中圖1表示根據(jù)本發(fā)明一個實施例用來評估至少一個標(biāo)記的方法和計算機程序產(chǎn)品的方塊圖;圖2表示當(dāng)與對應(yīng)實際結(jié)果相比較時,候選預(yù)后可能位于其內(nèi)的四個可能象限內(nèi)的圖形表示,所描繪的象限可以用來產(chǎn)生用于候選預(yù)后的靈敏性和特異性對;圖3表示根據(jù)本發(fā)明一個實施例畫出靈敏性和特異性對的ROC曲線的例子,該靈敏性和特異性對可以用來選擇標(biāo)記特征和/或閾值的最佳組合,從而使由標(biāo)記或標(biāo)記的組合建立的預(yù)后的靈敏性和特異性都最大;圖4表示根據(jù)本發(fā)明一個實施例用來評估至少一個標(biāo)記和估計所述至少一個標(biāo)記相對于至少一個互補標(biāo)記的獨立性的方法和計算機程序產(chǎn)品的方塊圖;及圖5表示在單個標(biāo)記分析中通過按候選閾值的比例畫出良好和不良結(jié)果的分布來確定用于給定特征的最佳閾值的可見表示。
具體實施例方式
本發(fā)明提供用來評估和優(yōu)化在建立癌癥病人的預(yù)后時使用的標(biāo)記候選物的方法。盡管下面描述的標(biāo)記(和其具體特征)對于建立用于乳腺癌病人(并且更具體地說早期乳腺癌病人)的預(yù)后特別有用,但這里公開的方法可以用來評估和優(yōu)化在建立患有任何疾病的病人的預(yù)后時使用的標(biāo)記候選物,該疾病可能鏈接到(經(jīng)過例如臨床數(shù)據(jù))適合于通過例如色度生物標(biāo)記(標(biāo)記)可順從染色(staining)的特定蛋白質(zhì)或其它目標(biāo)分子的過分表達(dá)上。因而,本領(lǐng)域的技術(shù)人員將認(rèn)識到,這里公開的方法對于建立病人的預(yù)后時使用的標(biāo)記的分析和優(yōu)化是可應(yīng)用的,該病人具有鏈接到可以標(biāo)記和以后經(jīng)顯微鏡法分析的蛋白質(zhì)或目標(biāo)分子的表達(dá)的其它形式的癌癥或其它疾病。
這里公開的方法也應(yīng)用于評估標(biāo)記,該標(biāo)記在預(yù)測乳腺癌病人對于所選擇治療的響應(yīng)可能是有用的。通過“預(yù)測乳腺癌病人對于所選擇治療的響應(yīng)”,打算估計病人對于特定治療將經(jīng)歷陽性和陰性結(jié)果的可能性。如這里使用的那樣,“指示陽性治療結(jié)果”是指,病人將經(jīng)歷來自選擇治療的有益結(jié)果(例如,完全或部分緩解、減小腫瘤尺寸等等)的增大可能性。通過“指示陰性治療結(jié)果”意指,相對于潛在乳腺癌的進展,將不從所選擇治療受益的增大可能性。在本發(fā)明的某些方面,所述選擇治療是化學(xué)療法。
這里公開的方法也應(yīng)用于評估和/或優(yōu)化在辨別或診斷癌癥(特別是乳腺癌)時有用的標(biāo)記?!霸\斷乳腺癌”打算包括例如診斷或探測乳腺癌的存在、監(jiān)視疾病的進展、及辨別或探測指示乳腺癌的細(xì)胞或樣本。所述術(shù)語診斷、確定、及辨別癌癥這里被可互換地使用。在特定實施例中,本發(fā)明的方法通過優(yōu)化在診斷乳腺癌或其它疾病時是最有效的標(biāo)記和/或標(biāo)記的組合,可以有利于早期乳腺癌的探測,該乳腺癌或其它疾病可以由給定標(biāo)記的探測來標(biāo)識和/或診斷,因為該給定標(biāo)記在身體樣本中或者被過分表達(dá)、或者呈現(xiàn)表達(dá)損失(如染色的組織學(xué)切片或細(xì)胞學(xué)切片)。
這里描述的方法涉及應(yīng)用多個閾值到給定標(biāo)記(生物標(biāo)記或色度生物標(biāo)記)的選擇特征,該給定標(biāo)記的過分表達(dá)可以指示對于給定病人的良好結(jié)果或不良結(jié)果。本領(lǐng)域的技術(shù)人員將認(rèn)識到,本發(fā)明的方法可以應(yīng)用于表示表達(dá)損失的標(biāo)記,像例如在黑素瘤情況下表示表達(dá)損失的melastatin。此外,本發(fā)明的方法基于可量化特征(和應(yīng)用于其的多個閾值)的系統(tǒng)分析把可能經(jīng)歷疾病復(fù)發(fā)(即,不良預(yù)后)的病人與更可能保持免于癌癥(即,良好預(yù)后)的那些人區(qū)分開,該可量化特征通過已經(jīng)暴露于一種或多種生物標(biāo)記的組織樣本(如制備的組織學(xué)切片)的色度分析可以被強調(diào)。更具體地說,本發(fā)明的方法涉及評估已經(jīng)暴露于標(biāo)記(如色度生物標(biāo)記)的給定組織樣本的特征、和挑選用于每種特征的最佳閾值的系統(tǒng)性過程,從而所述標(biāo)記可以按照所述特征和對應(yīng)最佳閾值被分析,從而標(biāo)記/閾值組合提供了與已知實際病人結(jié)果比較時是最準(zhǔn)確的預(yù)后。因而,本發(fā)明的方法還可以用來選擇標(biāo)記的最佳組合、其特征、及用于每個特定特征的閾值,從而提供對于早期癌癥病人的更準(zhǔn)確預(yù)后。
由本發(fā)明評估的生物標(biāo)記包括基因和蛋白質(zhì)。這樣的生物標(biāo)記包括DNA,該DNA包括編碼生物標(biāo)記的核酸順序的全部或部分順序、或這樣一種順序的補體。生物標(biāo)記核酸也包括RNA,該RNA包括感興趣的核酸順序的任一種的全部或部分順序。生物標(biāo)記蛋白質(zhì)是由本發(fā)明的DNA生物標(biāo)記編碼、或與其相對應(yīng)的蛋白質(zhì)。生物標(biāo)記蛋白質(zhì)包括生物標(biāo)記蛋白質(zhì)或多肽任意之一的全部或部分氨基酸順序。
“生物標(biāo)記”是任何基因或蛋白質(zhì),其在組織或細(xì)胞中的表達(dá)水平與正?;蚪】导?xì)胞或組織的表達(dá)水平相比被改變。生物標(biāo)記根據(jù)本發(fā)明的一個實施例是基因和蛋白質(zhì),該基因和蛋白質(zhì)的過分表達(dá)與癌癥預(yù)后相關(guān),并且具體地說,在這里呈現(xiàn)的例子中,與乳腺癌預(yù)后相關(guān)。在某些情況下,在病人樣本中感興趣的生物標(biāo)記或生物標(biāo)記的組合的選擇性的過分表達(dá)指示不良癌癥預(yù)后。通過“指示不良預(yù)后”是意指,特定生物標(biāo)記的過分表達(dá)與在少于五年內(nèi)的潛在癌癥或腫瘤的再發(fā)或復(fù)發(fā)、轉(zhuǎn)移、或死亡的增大可能性相關(guān)聯(lián)。指示不良預(yù)后的生物標(biāo)記這里可以稱作“不良結(jié)果生物標(biāo)記”。在本發(fā)明的其它方面,感興趣的生物標(biāo)記或生物標(biāo)記的組合的選擇性過分表達(dá)指示良好預(yù)后。如這里使用的那樣,“指示良好預(yù)后”是指病人將保持免于癌癥至少五年的增大可能性。這樣的生物標(biāo)記可以稱作“良好結(jié)果生物標(biāo)記”。
由本發(fā)明的方法可以評估的生物標(biāo)記包括任何基因或蛋白質(zhì),該基因或蛋白質(zhì)的過分表達(dá)與癌癥預(yù)后相關(guān)聯(lián),如以上描述那樣。生物標(biāo)記包括指示不良癌癥預(yù)后的基因和蛋白質(zhì)(即,不良結(jié)果生物標(biāo)記)、以及指示良好預(yù)后的那些(即,良好結(jié)果生物標(biāo)記)。特別感興趣的生物標(biāo)記包括在細(xì)胞生長和增生、細(xì)胞周期控制、DNA復(fù)制和轉(zhuǎn)錄、凋亡、信號轉(zhuǎn)導(dǎo)、血管生成/淋巴生成、或轉(zhuǎn)移的調(diào)節(jié)中涉及的基因和蛋白質(zhì)。在某些實施例中,生物標(biāo)記調(diào)節(jié)在組織重建、細(xì)胞外基質(zhì)降解、及相鄰組織侵入中涉及的蛋白酶系統(tǒng)。盡管其過分表達(dá)指示癌癥預(yù)后的任何生物標(biāo)記在本發(fā)明的方法中可以被分析和/或利用,但在評估乳腺癌預(yù)后的特定實施例中,生物標(biāo)記從包括SLPI、p21ras、MUC-1、DARPP-32、phospho-p27、src、MGC 14832、myc、TGFβ-3、SERHL、E2F1、PDGFRα、NDRG-1、MCM2、PSMB9、MCM6、及p53的組中選擇。更優(yōu)選地,在建立乳腺癌預(yù)后時的感興趣的生物標(biāo)記包括SLPI、PSMB9、NDRG-1、Muc-1、phospho-p27、src、E2F1、p21ras、或p53。在本發(fā)明的一個方面,如在這里包括的實驗例子中表明的那樣,用來評估乳腺癌預(yù)后的方法包括探測E2F1和從包括SLPI、src、phosph-p27、p21ras、及PSMB9的組中選擇的至少一個其它生物標(biāo)記的過份表達(dá)。
這里所討論的術(shù)語“特征”是指通過暴露于給定標(biāo)記和/或生物標(biāo)記在身體樣本中產(chǎn)生的可感覺和/或可量化的變化。特征可以包括由色度標(biāo)記(包括以上討論的標(biāo)記)的染色特性產(chǎn)生的透射率或光學(xué)密度值的變化,該變化例如可以使用顯微鏡法技術(shù)和圖像處理系統(tǒng)探測。這樣的顯微鏡法技術(shù)和/或圖像處理系統(tǒng),在生物樣本已經(jīng)染色以可見地指示感興趣的特定生物標(biāo)記的存在(并因而指示對應(yīng)特定蛋白質(zhì)和/或感興趣的目標(biāo)分子的存在)之后,用來提供生物樣本的圖像。這些方法和相關(guān)系統(tǒng)中的一些,如在通過參考包括在這里的授予Marcelpoil等的美國專利申請09/957,446(‘446申請)和授予Marcelpoil等的美國專利申請10/057,729(‘729申請)中公開的那些,分別公開圖像處理系統(tǒng)、方法、及相關(guān)計算機程序產(chǎn)品的使用,以基于由那些顏色染料標(biāo)記的光學(xué)密度或透射率值所指示的代表性顏色染料的存在,確定在給定圖像中每個分子種類的相對量,如由成像系統(tǒng)和相關(guān)軟件確定的那樣。這些技術(shù)還可以提供每種目標(biāo)分子或蛋白質(zhì)的相對量的定量確定,該目標(biāo)分子或蛋白質(zhì)的過分表達(dá)可以由應(yīng)用于組織樣本切片上的色度生物標(biāo)記所揭示。例如,給定標(biāo)記的特征的表達(dá)可以使用被標(biāo)記組織樣本切片的數(shù)字圖像而揭示,其中標(biāo)記使用與其成分紅、綠、及藍(lán)(RGB)顏色部分的彩色基因(chromagen)分離,與背景染色和/或其它標(biāo)記相分離,從而在從病人取得的身體樣本內(nèi)在感興趣的細(xì)胞或區(qū)域內(nèi)可以確定標(biāo)記的相對影響(相對于背景染色和/或來自其它標(biāo)記的染色)。
根據(jù)本發(fā)明的各種實施例,各種特征(可量化和非可量化的)可以使用圖像處理系統(tǒng)從標(biāo)記組織樣本(如用色度生物標(biāo)記染色的制備組織學(xué)切片)取得的圖像抽取,該圖像處理系統(tǒng)能夠捕獲感興趣的區(qū)域(ROI)、各種視場(FOV)或整個組織學(xué)切片的圖像,并且確定其中限定的形態(tài)邊界,如包括細(xì)胞核、細(xì)胞質(zhì)、及細(xì)胞膜的細(xì)胞的各種區(qū)域。用來確定在切片和/或身體樣本內(nèi)的形態(tài)邊界的這種圖像處理步驟稱作分段(segmentation)。感興趣的區(qū)域(ROI),根據(jù)各種實施例,可以跨過整個切片、切片的部分、切片的離散選擇部分、和/或整個FOV。形態(tài)邊界的準(zhǔn)確分段(經(jīng)顯微鏡法和/或圖像分析)要求多種特征的確定,因為各種不同的生物標(biāo)記類型在給定身體樣本的細(xì)胞內(nèi)呈現(xiàn)不同的亞細(xì)胞位置。例如,某些生物標(biāo)記揭示僅在細(xì)胞的細(xì)胞核內(nèi)的目標(biāo)分子的過分表達(dá)。其它標(biāo)記可能揭示在細(xì)胞的細(xì)胞質(zhì)內(nèi)或在細(xì)胞膜內(nèi)的目標(biāo)分子的過分表達(dá)。例如,表1表示,在建立用于乳腺癌的預(yù)后和/或診斷時使用的一些標(biāo)記與它們的亞細(xì)胞定位的相應(yīng)區(qū)域一起列出。
如在示范特征的附錄中描述的那樣,某些細(xì)胞描述符特征,如CELL、CYTO、MEMB、及NUCL(分別稱作細(xì)胞、細(xì)胞質(zhì)、細(xì)胞膜、及細(xì)胞核)用作在身體樣本的細(xì)胞中的位置標(biāo)識符,其中由特定標(biāo)記呈現(xiàn)的特征可以使用例如染料或染劑的彩色基因分離而探測和/或量化。
也表示在附錄中的是可以由本發(fā)明的方法抽取、檢查和或量化的各種生物標(biāo)記的多個其它典型特征,以便優(yōu)化給定生物標(biāo)記或生物標(biāo)記的組合的預(yù)后值。所述特征一般按如下分類形狀描述符特征;紋理和/或直方圖描述符特征(它們主要指關(guān)于由特定生物標(biāo)記可以強調(diào)的目標(biāo)分子過分表達(dá)的量和變化的統(tǒng)計確定);光譜描述符特征(如可以用來揭示目標(biāo)分子的過分表達(dá)的各種色度生物標(biāo)記和/或復(fù)染劑的透射率或光學(xué)密度);層次描述符特征(它們用來計算相對于由成像系統(tǒng)捕獲的分層次的物體的可量化特征);及細(xì)胞描述符特征(包括CELL、CYTO、MEMB、及NUCL,如在以上描述和在示范特征的附錄中詳細(xì)說明的那樣)。以上概括地和在這里附屬的示范特征的附錄中更詳細(xì)地描述的特征的清單不意味著是窮盡的,并且意味著僅用作例子。本發(fā)明的方法可以利用各種不同的可量化特征(和其各種組合),以便優(yōu)化給定標(biāo)記或標(biāo)記的組合的預(yù)后值。根據(jù)本發(fā)明的計算機程序產(chǎn)品實施例,這里描述的特征可以以自動方式由例如構(gòu)造成控制圖像處理系統(tǒng)的控制器(如計算機裝置)探測,該圖像處理系統(tǒng)具有如下能力標(biāo)記感興趣的區(qū)域(ROI);分段細(xì)胞或組織樣本的各種腔和成分;及/或把染劑或染料解體成RGB部分,從而確定透射率、亮度、光學(xué)密度及/或其它光譜特征。
在本發(fā)明的某些實施例中,以上特征和其它可以組合以創(chuàng)建包括幾種類型的基礎(chǔ)特征的概括特征,以便為了提供給定病人的診斷和/或預(yù)后的目的而創(chuàng)建可能具有實用性的可量化特征。為了建造這樣一種概括特征,其它更具體的特征可以被量化和檢查,以便創(chuàng)建所述概括特征,其在某些情況下對于尋求從由生物標(biāo)記和/或生物標(biāo)記的集合所強調(diào)的特征得到預(yù)后和/或診斷值的臨床醫(yī)師可能具有更多意義。例如,在這里描述的實驗例子中,利用的特征包括癌癥細(xì)胞的各種等級的數(shù)值百分比,該癌癥細(xì)胞被認(rèn)為在身體樣本(如組織學(xué)切片)中辨別的特定感興趣區(qū)域(ROI)中給定細(xì)胞集合(可被強調(diào))中存在。本領(lǐng)域的技術(shù)人員將認(rèn)識到,病理學(xué)家通過確定在感興趣區(qū)域(ROI)中存在的標(biāo)記的程度(如顯得染色得比周圍區(qū)域深的組織學(xué)切片的面積),在例如經(jīng)顯微鏡法觀看時可以“分級”已經(jīng)用標(biāo)記染色的細(xì)胞。盡管通過病理學(xué)家的肉眼分級有助于確定在細(xì)胞中存在的標(biāo)記的相對水平,但這樣的分級相當(dāng)主觀,并且可能根據(jù)各個臨床醫(yī)師和在各種上下文中而變。因而,在建造本發(fā)明中的概括特征時,可疑癌細(xì)胞可以更客觀地分級成例如0(指示在目標(biāo)細(xì)胞腔中完全不存在標(biāo)記)、1(指示在目標(biāo)細(xì)胞腔中存在某些少量標(biāo)記)、2(指示在目標(biāo)細(xì)胞腔中存在中等水平的標(biāo)記)、或3(指示在目標(biāo)細(xì)胞腔中存在高水平的標(biāo)記)。這樣的分級可以使用視頻-顯微鏡法系統(tǒng)和/或圖像處理系統(tǒng),如在‘446申請和‘729申請中公開的那些,以自動方式完成。如下面在表2中概括的那樣,根據(jù)本發(fā)明的一個例子,由NUCL、CYTO、MEMB、DYE2、OD、及MEAN指示的特征可以組合,以產(chǎn)生具有各種值的光學(xué)透射率值,該各種值可以分隔以確定在給定細(xì)胞中給定色度生物標(biāo)記(或在某些實例中,其色度成分)的水平(例如,由“DYE2”指示)。相同染料可以用來使給定生物標(biāo)記成為色度生物標(biāo)記(例如,通常使用的染料染劑,如對于本領(lǐng)域的技術(shù)人員熟知的DAB或其它),然而,由本發(fā)明評估的各種不同標(biāo)記可以揭示在各種細(xì)胞腔(如細(xì)胞核、細(xì)胞膜、及/或細(xì)胞質(zhì))中目標(biāo)分子的存在。示范閾值(與透射率值相對應(yīng)),在表2中表示的這種情況下,因而可以把所觀察細(xì)胞的每一個分派到如下類別之一中0、1、2、或3。與非染色細(xì)胞(即,當(dāng)暴露于標(biāo)記時不呈現(xiàn)目標(biāo)分子的過分表達(dá)的細(xì)胞)的期望數(shù)量相對應(yīng)的類別0的評估可以使用圖像處理系統(tǒng)和/或顯微鏡法進行。0(非染色)細(xì)胞的近似數(shù)量還可以使用在這個特定實施例中由1、2及3細(xì)胞面積的計算(使用下面列出的確定)得到的平均腫瘤面積(例如,由叫做CELL AREA的特征(見示范特征的附錄)所估計的1100象素)而計算
N1=NNeg Rof(1)N2=NTest(2)N3=NPos Ref(3)NTotal=max(N1+N2+N3,FOCUS_AREA1100)---(4)]]>N0=max(0,NTotal-N1-N2-N3)(5)在其它實施例中,細(xì)胞的數(shù)量可以使用除確定細(xì)胞面積之外的方法而計算(如通過計數(shù)在用細(xì)胞核定位標(biāo)記染色的FOV內(nèi)的細(xì)胞核)。一旦0、1、2、及3細(xì)胞類型的數(shù)量(分別為N0、N1、N2及N3)被確定(使用例如在表2中給出的各種閾值),就可以計算0、1、2及3細(xì)胞的百分比。表3呈現(xiàn)使用前綴CELL_PERCENT以及表示以給定百分比反映的細(xì)胞類型的數(shù)值標(biāo)識符的這些新概括特征的名稱。這些示范概括特征可以作為簡單的百分比而計算。例如,CELL_PERCENT_0可以按如下計算CELL_PERCENT_0=N0NTotal×100---(6)]]>盡管在這里描述的實驗例子中使用以上描述的CELL_PERCENT概括特征,但作為本發(fā)明的方法和計算機程序產(chǎn)品的實施例的部分可以評估任何數(shù)量的可能的可量化特征。例如,在示范特征的附錄中公開的色度特征的一個或多個(與例如使用圖像分析系統(tǒng)的染色組織學(xué)切片的分析有關(guān))可以組合以形成另一種類型的概括特征,或者在附錄中描述的各個特征可以獨立地使用和分析。
以上描述的各種特征和概括特征在一個或多個標(biāo)記的分析中是可應(yīng)用的,該標(biāo)記可以用來染色身體樣本(或由此制備的切片,例如組織學(xué)切片),以便建立(或幫助建立)用于癌癥病人(如早期乳腺癌病人)的預(yù)后。根據(jù)本發(fā)明的實施例,所述標(biāo)記和其特征的不同組合可以使用本發(fā)明的實施例評估,以建立特征、特征閾值(如在給定感興趣區(qū)域(ROI)中的類型-2癌癥細(xì)胞的給定CELL_PERCENT)、及標(biāo)記類型的最佳組合,從而可以優(yōu)化給定標(biāo)記或標(biāo)記組合的靈敏性和特異性。另外,其它類型的基于病人的特征可以與這里公開的特征相組合,如(但不限于)病人年齡;病人醫(yī)療史;及指示用于癌癥病人的可能預(yù)后和/或診斷的其它因素。例如,淋巴結(jié)牽涉、腫瘤尺寸、組織學(xué)等級、雌激素和黃體酮受體水平、Her 2/神經(jīng)鞘狀態(tài)、腫瘤倍性、及家族史可能都是幫助用于早期乳腺癌病人的預(yù)后建立的預(yù)后和/或診斷因素。
使用本發(fā)明的方法和計算機程序產(chǎn)品,特征、閾值、及標(biāo)記組合可以被高效地和系統(tǒng)地分析和評估,以在建立用于任何給定癌癥病人的預(yù)后時確定最佳特異性和靈敏性。在本發(fā)明的方法和計算機程序產(chǎn)品中,用來估計特異性和靈敏性的終點是預(yù)后(例如,使用特定候選標(biāo)記和/或?qū)?yīng)候選特征預(yù)測的結(jié)果)與實際臨床結(jié)果(即,病人是否在五年內(nèi)保持免于癌癥或經(jīng)受復(fù)發(fā))的比較。如圖2中所示,由多個候選特征/閾值組合產(chǎn)生的候選預(yù)后可以基于在本發(fā)明的方法中使用的身體樣本的已知結(jié)果在所表示的四象限矩陣中畫出,以確定由給定標(biāo)記/特征(和/或決定規(guī)則)組合產(chǎn)生的真實陽性的210、真實陰性的240、虛假陽性的220、及虛假陰性的230預(yù)后的數(shù)量,如以下面更詳細(xì)描述的那樣。在計算真實陽性的210、真實陰性的240、虛假陽性的220、及虛假陰性的230預(yù)后的相對數(shù)量之后,可以計算特性靈敏性和特異性對,以估計標(biāo)記/特征/決定規(guī)則組合作為預(yù)后工具的有效性(如以下面更詳細(xì)描述的那樣)。
如這里使用的那樣,“特異性(specificity)”是指本發(fā)明的方法可準(zhǔn)確地辨別真實陰性的水平。在臨床研究中,特異性通過把真實陰性的數(shù)量除以真實陰性和虛假陽性之和而計算(如通過在圖2的象限中畫出候選預(yù)后而確定的那樣)。由“靈敏性(sensitivity)”意指本發(fā)明的方法可準(zhǔn)確地辨別是真實陽性的樣本的水平。靈敏性在臨床研究中通過把真實陽性的數(shù)量除以真實陽性和虛假陰性之和而計算(也如通過在圖2的象限中畫出候選預(yù)后而確定的那樣)。在某些實施例中,由所公開方法揭露的標(biāo)記、特征、及閾值的給定組合的靈敏性是至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大。此外,由本評估方法可得到的特異性優(yōu)選地至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大。
如這里使用的那樣,“真實”和“虛假”的陽性和陰性將取決于考慮的標(biāo)記或標(biāo)記組合是良好結(jié)果還是不良結(jié)果標(biāo)記。就是說,在良好結(jié)果標(biāo)記(即,指示良好預(yù)后的那些)的情況下,“真實陽性”是指,呈現(xiàn)感興趣生物標(biāo)記的過分表達(dá)-如由本發(fā)明的方法確定那樣(例如,通過免疫組織化學(xué)的陽性染色)、具有證實的良好實際臨床結(jié)果的那些樣本。相反,“虛假陽性”顯示良好結(jié)果生物標(biāo)記的過分表達(dá),但具有證實的不良實際臨床結(jié)果。關(guān)于良好結(jié)果標(biāo)記的“真實陰性”和“虛假陰性”不顯示標(biāo)記過分表達(dá)(例如,在免疫組織化學(xué)方法中不染色陽性),并且分別證實不良和良好的實際臨床結(jié)果。
類似地,在不良結(jié)果標(biāo)記的情況下,“真實陽性”是指,呈現(xiàn)感興趣的標(biāo)記或組合標(biāo)記的過分表達(dá)、具有證實的不良實際臨床結(jié)果的那些樣本??傊P(guān)于良好和不良結(jié)果生物標(biāo)記的“真實陽性”是指,其中準(zhǔn)確地預(yù)測實際臨床結(jié)果(即,良好或不良)的樣本。“虛假陽性”顯示不良結(jié)果生物標(biāo)記的過分表達(dá),但具有證實的良好實際臨床結(jié)果。關(guān)于不良結(jié)果生物標(biāo)記的“真實陰性”和“虛假陰性”不顯示生物標(biāo)記過分表達(dá),并且分別具有證實良好和不良的實際臨床結(jié)果。本發(fā)明的方法和計算機程序產(chǎn)品利用使用多個標(biāo)記、標(biāo)記的特征、及用于給定特征的閾值產(chǎn)生的預(yù)后與實際臨床結(jié)果的系統(tǒng)比較,以便確定標(biāo)記、特征、及閾值的哪種最佳組合最可能提供由實際臨床結(jié)果所定義的最準(zhǔn)確的預(yù)后。
圖1表示用來評估至少一個標(biāo)記的根據(jù)本發(fā)明一個實施例的方法的示意流程圖,該至少一個標(biāo)記可以用來確定癌癥病人的預(yù)后。步驟110表示暴露步驟,包括把多個身體樣本暴露于一個標(biāo)記(或在某些情況下,多個標(biāo)記)。所述多個身體樣本例如從對應(yīng)的多個病人取得,其中每個病人具有已知臨床結(jié)果。如以上更詳細(xì)描述的那樣,所述標(biāo)記可以包括各種色度生物標(biāo)記,該色度生物標(biāo)記可以用來探測在給定細(xì)胞中可能被過分表達(dá)的各種目標(biāo)分子(例如,蛋白質(zhì))。所述身體樣本可以包括從具有疾病的病人取得的活檢組織樣本,本發(fā)明的方法正在用來對于該疾病評估所述標(biāo)記。
步驟120表示根據(jù)本發(fā)明的方法的下個步驟,該步驟包括使用圖像處理系統(tǒng)從多個切片的每一個的取得圖像抽取至少一個可量化特征,其中所述多個切片從與具有已知結(jié)果的每個病人相對應(yīng)的多個身體樣本制備。所述切片可以保持活檢芯樣本或其它組織樣本的順序截面,并且可以暴露于可以在評估下的所述標(biāo)記的一個或多個,作為本發(fā)明的方法的一部分。所述切片可以包括被著色和/或染色以促進可量化特征(如顏色、陰影、亮度、透射率(TRANS)、光學(xué)密度(OD)、或以上更詳細(xì)描述的其它特征的可感覺變化)的抽取的組織學(xué)切片。例如,所述切片可以用染劑處理,以強調(diào)所述身體樣本所暴露于的標(biāo)記(或多個標(biāo)記)。另外,所述切片可以用復(fù)染劑處理,其具有傾向于強調(diào)所述感興趣的一個或多個標(biāo)記的染色的顏色和/或染色特性。本領(lǐng)域的技術(shù)人員將認(rèn)識到,這樣的色度染劑可以包括DAB(傾向于把標(biāo)記的外觀染成棕色),并且復(fù)染劑可以包括蘇木精(傾向于把細(xì)胞的正常形態(tài)染成藍(lán)色)。另外,染色切片的任一種可以使用例如在‘446申請和‘729申請中公開的彩色基因分離技術(shù)而分析。
如上所述,抽取步驟可以涉及使用例如構(gòu)造成分析給定圖像(如整個切片、攝像機視場(FOV)、或選擇的感興趣區(qū)域(ROI))的圖像分析系統(tǒng)和相關(guān)控制器(如計算機裝置),從切片的視頻-顯微鏡法圖像抽取特征。如在附屬的示范特征附錄中詳細(xì)描述的那樣,與已經(jīng)暴露于給定標(biāo)記(或標(biāo)記集合)的切片的圖像相關(guān)的多種不同特征可以被抽取和分析。在某些實施例中,諸如病理學(xué)家之類的臨床醫(yī)師可以利用圖像分析系統(tǒng)選擇ROI(例如與用DAB染暗從而指示大量給定標(biāo)記的存在的顯微鏡法圖像的區(qū)域相對應(yīng))。在ROI內(nèi),圖像分析系統(tǒng)(和與其通信的控制器)可以用來隔離和抽取在附屬附錄中描述的多個特征。例如,在ROI內(nèi)的多個細(xì)胞可以被計算,并且其中類型1細(xì)胞的百分比也可以被計算(在確定透射過在ROI內(nèi)包含的不同細(xì)胞腔(取決于標(biāo)記類型)的光的光學(xué)密度之后,通過應(yīng)用例如在表2中概述的分配器設(shè)置)。為了應(yīng)用閥值或客觀決定規(guī)則(見步驟130,下面詳細(xì)描述),所述特征在大多數(shù)情況下是可量化特征,如百分比、細(xì)胞數(shù)量、面積、亮度、透射率、及/或光學(xué)密度。例如,在所附的實驗例子中,所述概括特征從包括類型1、類型2、及類型3癌癥細(xì)胞的百分比(和這些百分比的組合)的各種ROI抽取,其中所述百分比通過組合更特定的特征(如用來把給定細(xì)胞分派到特定類型指示(例如,類型1、2、或3)的細(xì)胞的染色區(qū)域的透射率和/或光學(xué)密度)而計算。
本發(fā)明方法的一個實施例的步驟130包括把多個候選決定規(guī)則應(yīng)用于多個切片每一個的抽取可量化特征,從而為切片的每一個提供對應(yīng)的候選預(yù)后?!皼Q定規(guī)則”可由幾種成分組成,包括疾病規(guī)則(它涉及大于給定閾值的可量化特征指示良好預(yù)后還是不良預(yù)后的確定)以及用于給定的可量化特征的閾值。在具有單一特征的單一標(biāo)記的分析中,決定規(guī)則可以是對所述特定特征的二進制決定。根據(jù)本發(fā)明的多個實施例,整個決定規(guī)則涉及產(chǎn)生良好或不良候選預(yù)后(取決于所述候選閾值和所述對應(yīng)的疾病規(guī)則)。例如,根據(jù)一個實施例,良好預(yù)后可以指示為零(0),并且不良預(yù)后可以指示為(1)。然而,對于每個可能閾值,有用于疾病規(guī)則的兩個可能選擇(即,良好預(yù)后(0)可以指小于閾值的值,或者可選擇地,不良預(yù)后(1)可以指小于閾值的值)。因而,每個疾病規(guī)則(對每個可能閾值)可以為每個身體樣本(與具有已知結(jié)果的病人相對應(yīng))被評估,并且放置在與圖2中所示的如下類別之一相對應(yīng)的四個象限之一中真實陽性(象限a,210)、虛假陽性(象限b,220)、虛假陰性(象限c,230)、及真實陰性(象限d,240)。然后可以為用于每個身體樣本(與具有已知結(jié)果的病人相對應(yīng))的可能閾值/疾病規(guī)則組合的每一個而產(chǎn)生一個可能預(yù)后,從而用于每個閾值的最佳疾病規(guī)則可以通過對圖2中的每個象限,基于在該象限中的良好和不良結(jié)果的出現(xiàn),挑選疾病規(guī)則而確定。
例如,給定用于標(biāo)記的特定可量化特征(F)的閾值(T),兩個疾病規(guī)則可能確定預(yù)后。第一可能的規(guī)則是,如果F大于T,則預(yù)后是不良(1)。第二可能規(guī)則是如果F大于T,則預(yù)后是良好(0)。對于這些可能的疾病規(guī)則的每一個,所預(yù)測的預(yù)后可能或者準(zhǔn)確地預(yù)測實際病人結(jié)果(即,產(chǎn)生真實陽性或真實陰性),或者未能預(yù)測實際病人結(jié)果(即,產(chǎn)生虛假陽性或虛假陰性)。有可能確定圖2的哪個象限包含最多的可能預(yù)后,以確定哪個疾病規(guī)則最適合給定可量化特征。例如,參照圖2,用于第一可能規(guī)則的可能預(yù)后可以被畫出,以確定結(jié)果位于何處。另外,用于第二可能規(guī)則的可能預(yù)后可以被畫出,以確定結(jié)果位于在圖2中描繪的象限內(nèi)的何處。在適當(dāng)象限中畫出兩種可能疾病規(guī)則之后,通過確定預(yù)測良好對不良結(jié)果的比率,歸一化到所述良好和不良結(jié)果的總數(shù),可以確定最佳疾病規(guī)則。例如,對于給定的特征和閾值,如果使用第一可能疾病規(guī)則(如果F>T,則預(yù)后=不良(1)),則大多數(shù)畫出點可能位于真實陽性象限中。在這種情況下,可能產(chǎn)生如下候選決定規(guī)則呈現(xiàn)在所述閾值以上的可量化特征的病人被認(rèn)為具有不良預(yù)后(對于疾病的陽性)。在另一個例子中,如果使用第一可能規(guī)則如果F<T,則預(yù)后=良好(0),則大多數(shù)畫出點可能位于虛假陰性象限中。在這種情況下,候選決定規(guī)則可能讀作呈現(xiàn)在所述閾值以上的可量化特征的病人被認(rèn)為具有良好預(yù)后(對于疾病的陰性)。本領(lǐng)域的技術(shù)人員將認(rèn)識到,其它統(tǒng)計方法也可以用來求出高效決定規(guī)則。例如,線性判別、二次判別、一般化線性模型、邏輯回歸、處罰判別、柔性判別、混合判別、及/或其它統(tǒng)計方法可以用來求出這樣的決定規(guī)則,作為本發(fā)明的步驟130的部分。
如圖1中所示,步驟140包括對至少一個可量化特征選擇最佳決定規(guī)則,該最佳決定規(guī)則從所述多個候選決定規(guī)則中選擇。最佳決定規(guī)則被選擇為,所述多個切片的每一個的候選預(yù)后最佳地與對于多個病人的每一個的已知結(jié)果相對應(yīng)。例如,從所述多個候選決定規(guī)則中挑選所述決定規(guī)則,從而提供了與從其取得身體樣本(見步驟110)的病人的臨床結(jié)果比較時產(chǎn)生最小數(shù)量的虛假陰性和虛假陽性的最佳預(yù)測預(yù)后工具。如上所述,所述候選決定規(guī)則具有閾值成分和疾病規(guī)則成分。通過系統(tǒng)地評估多個候選閾值(和疾病規(guī)則)可以挑選最佳閾值,從而對多個切片的每一個由該最佳閾值生成的最佳預(yù)后可以最接近地與多個病人的每一個(由其產(chǎn)生多個切片)的已知結(jié)果相對應(yīng)。另外,使用特異性和靈敏性可以測試給定決定規(guī)則的效率,如下面在公式7和8中表示的那樣。
根據(jù)本發(fā)明的某些實施例,選擇最佳決定規(guī)則還包括確定與多個候選決定規(guī)則的每一個相對應(yīng)的多個特異性和靈敏性對。在這樣的實施例中,用于每個候選決定規(guī)則(和用于多個候選閾值的每一個和對應(yīng)疾病規(guī)則)的特異性和靈敏性可以通過把來自每個候選決定規(guī)則的候選預(yù)后與從其取得身體樣本的每個病人的實際已知結(jié)果相比較而計算。在進行這種比較時,真實陽性(象限a)、虛假陽性(象限b)、虛假陰性(象限c)、及真實陰性(象限d)的相對數(shù)量的每一個可以使用象限系統(tǒng)而確定,如使用在圖2中描繪的系統(tǒng)。使用每個象限的相對數(shù)量,對于每個候選決定規(guī)則和所述多個候選閾值的每一個使用如下公式可以計算靈敏性和特異性對(sens,spec) 因而,如以上一般描述的那樣,靈敏性是指不良結(jié)果病人關(guān)于標(biāo)記被評估為陽性(即,當(dāng)作真實陽性)的概率。類似地,特異性是指a個良好結(jié)果病人關(guān)于標(biāo)記評估為陰性(即,當(dāng)作真實陰性)的概率。
特異性和靈敏性對的每一個然后可以在兩維靈敏性和特異性圖表上畫出,如圖3中所示,其中每個點是指對于多個候選決定規(guī)則的每一個(和對于多個候選閾值的每一個)計算的特異性和靈敏性值。在圖3中表示的圖表也稱作接收器操作特性(ROC)曲線,表示已經(jīng)同與實際臨床結(jié)果相對應(yīng)的數(shù)據(jù)集相比較的候選決定規(guī)則集的靈敏性值310和對應(yīng)特異性值300的曲線圖。理想預(yù)后試驗具有在點1,1處畫出的理想靈敏性和特異性對320,該點1,1指示所有預(yù)后結(jié)果,包括真實陽性或真實陰性(見在圖2中的象限a210和d240)。對ROC曲線上的每個畫出的靈敏性和特異性對,使用在畫出的和理想的數(shù)對之間的特異性差350和靈敏性差340,可以計算在畫出對與在(1,1)處的理想對320之間的歐幾里得距離。在畫出在圖3中所示的ROC曲線之后,可以辨別具有到理想對320的最小歐幾里得距離320的特異性和靈敏性對,從而可以選擇最佳決定規(guī)則(和對應(yīng)最佳閾值和/或疾病規(guī)則),以便瞄準(zhǔn)在評估下的標(biāo)記和特征組合的特定靈敏性和特異性對。此外,在某些實施例中,可以選擇最佳決定規(guī)則以便使在評估下的標(biāo)記和特征組合的靈敏性和特異性最大化(即接近理想(1,1)靈敏性和特異性對)。
如圖4中所示,本發(fā)明的某些方法還包括在塊150中示意表示的額外步驟,它包括評估至少一個標(biāo)記的統(tǒng)計獨立性,從而保證所述標(biāo)記能夠提供大體統(tǒng)計地獨立于至少一個互補標(biāo)記的預(yù)后。因而,這個實施例可以保證,對于應(yīng)用于身體樣本的給定標(biāo)記對,由其產(chǎn)生的預(yù)后是大體統(tǒng)計獨立的,從而一個標(biāo)記不會提供關(guān)于互補標(biāo)記的大體重復(fù)性信息。這可以保證,例如,當(dāng)互補標(biāo)記和第一標(biāo)記不是大體統(tǒng)計地獨立時,互補標(biāo)記不與第一標(biāo)記一起使用。兩個標(biāo)記的依賴性可以指示它們是重復(fù)的,并且第二標(biāo)記的添加不把額外值添加到給定標(biāo)記對的預(yù)后能力上。為了優(yōu)化給定標(biāo)記名單的預(yù)后能力,也希望通過最小化使用標(biāo)記(該標(biāo)記當(dāng)與在名單中的另一個標(biāo)記相比較時,提供重復(fù)的預(yù)后信息)而減小信號“噪聲”量。
兩個標(biāo)記的統(tǒng)計獨立性的評估例如在某些實施例中可能涉及如下額外步驟(1)把觀察結(jié)果的頻率分布與用于暴露于第一標(biāo)記和互補標(biāo)記的第一組身體樣本的理論預(yù)后的頻率分布相比較,其中第一組身體樣本與具有已知良好結(jié)果的病人相對應(yīng);(2)把觀察結(jié)果的頻率分布與用于暴露于所述第一標(biāo)記和所述互補標(biāo)記的第二組身體樣本的理論預(yù)后的頻率分布相比較,其中第二組身體樣本與具有已知不良結(jié)果的病人相對應(yīng);及(3)使用卡平方(X2)分析,估計所述至少一個標(biāo)記相對于至少一個互補標(biāo)記的獨立性。
例如,X2分析可以執(zhí)行,以便當(dāng)一次考慮2個標(biāo)記并且考慮到病人(與身體樣本相對應(yīng))的結(jié)果時估計標(biāo)記獨立性。表7詳細(xì)說明對于特定標(biāo)記、為良好和不良結(jié)果病人亞-人口(sub-population)如何得到X2值。根據(jù)一個例子,X2值以0.05的誤差概率(p)計算為7.81。因而,可以有如下結(jié)果(1)如果X2Good<7.81,那么不能拒絕H0Good;(2)如果X2Bad<7.81,那么不能拒絕H0Bad;及因而(3)如果(X2Good<7.81并且X2Bad<7.81),則不能拒絕H0,并且標(biāo)記可認(rèn)為是獨立的。
這里公開的方法也可以在一個或多個適當(dāng)計算機程序產(chǎn)品中實施,該計算機程序產(chǎn)品在計算機裝置(如與適于捕獲染色組織學(xué)切片或細(xì)胞學(xué)切片的圖像的顯微鏡法系統(tǒng)和/或圖像分析系統(tǒng)通信的計算機裝置)上是可執(zhí)行的,并且能夠完成與這里描述的方法和相關(guān)系統(tǒng)相關(guān)的各種功能。更具體地說,在圖1和4中表明的方法實施例的步驟120、130、140、及150可以借助于計算機程序產(chǎn)品完成,該計算機程序產(chǎn)品具有用來完成或否則定向待承擔(dān)的方法步驟的一個或多個可執(zhí)行部分。例如,在這樣的計算機程序?qū)嵤├校蓤?zhí)行部分通過促進在計算機裝置(或其它控制器裝置)、與適于抽取在包括在這里的示范特征的附錄中描述和詳細(xì)說明的特征的一個或多個的顯微鏡法系統(tǒng)或圖像分析系統(tǒng)之間的通信,可以完成在圖1和4中表示的步驟120。例如,由步驟120示意表明的可執(zhí)行部分可能能夠從與特定標(biāo)記的染色特性相對應(yīng)的染色組織學(xué)切片的數(shù)字圖像(經(jīng)圖像分析系統(tǒng)得到)抽取統(tǒng)計數(shù)據(jù)(或另一種可量化特征)。
另外本發(fā)明的計算機程序產(chǎn)品的可執(zhí)行部分經(jīng)窮盡的多個候選決定規(guī)則對從多個切片的每一個抽取的至少一個可量化特征的系統(tǒng)性應(yīng)用也可以完成在圖1和4中表示的步驟130,從而產(chǎn)生與窮盡的多個決定規(guī)則(在某些情況下,包括用于多個標(biāo)記組合和其特征的可能閾值和/或疾病規(guī)則的系統(tǒng)評估)的多種組合的每一種相對應(yīng)的一系列候選預(yù)后。
根據(jù)某些實施例,本發(fā)明的計算機程序產(chǎn)品的可執(zhí)行部分使用與在調(diào)查下的多個切片相對應(yīng)的病人的每一個的已知結(jié)果,通過計算對于候選預(yù)后的每一個的特異性和靈敏性對,也可以進行或促進在圖1和4中表示的步驟140。因而,在步驟140中示意表明的可執(zhí)行部分可以確定與目標(biāo)和/或最佳特異性和靈敏性對相對應(yīng)的決定規(guī)則。
最后,如圖4的步驟150中所示,本發(fā)明的計算機程序產(chǎn)品的可執(zhí)行部分使用以上關(guān)于本發(fā)明實施例的方法所描述的卡平方分析或其它技術(shù),也可以旨在和/或促進兩個或多個標(biāo)記的標(biāo)記獨立性的確定。這樣的確定也可以考慮到在從其取得多個切片(和其圖像)的病人人口中某些結(jié)果的普遍性。
因而,本領(lǐng)域的技術(shù)人員將認(rèn)識到,本發(fā)明實施例的計算機程序產(chǎn)品可以用來系統(tǒng)地評估在評估標(biāo)記集合時可能生成的閾值、疾病規(guī)則、及對應(yīng)的基于順序的決定規(guī)則的復(fù)雜組合,從而確定將接近和/或到達(dá)目標(biāo)和/或最佳特異性和靈敏性水平的標(biāo)記組合和與其對應(yīng)的決定規(guī)則。
本領(lǐng)域的技術(shù)人員將認(rèn)識到,在本發(fā)明的方法中的任何或所有步驟能由人實現(xiàn),或者可選擇地,以自動方式進行。因而,身體樣本制備(見例如步驟110)、樣本染色(見例如步驟110)、及生物標(biāo)記表達(dá)的探測(見例如步驟120)的步驟可以是自動的。況且,在某些實施例中,本發(fā)明的免疫組織化學(xué)方法與計算機化成像設(shè)備和/或軟件一道使用,以促進由病理學(xué)家對陽性染色細(xì)胞的分辨。這里公開的方法也能與其它預(yù)后方法或分析(例如,腫瘤尺寸、淋巴結(jié)狀態(tài)、其它生物標(biāo)記(包括例如Her2/神經(jīng)鞘、Ki67、雌激素受體(ER)、黃體酮受體(PR)及p53)的表達(dá)水平)相組合。以這種方式,使用這里描述的方法的生物標(biāo)記的優(yōu)化和評估可以促進由本發(fā)明評估的各種生物標(biāo)記的過分表達(dá)的探測,從而允許患有疾病的病人的預(yù)后的更準(zhǔn)確確定,該疾病可能與各種生物標(biāo)記的一個或多個的過分表達(dá)相鏈。
另外,對于本發(fā)明所屬領(lǐng)域的技術(shù)人員,將想到本發(fā)明的多種修改和其它實施例,其具有在以上描述和相關(guān)附圖、附錄及例子中呈現(xiàn)的講授的好處。因此,要理解,本發(fā)明不限于公開的特定實施例,并且修改和其它實施例打算包括在附屬權(quán)利要求書的范圍內(nèi)。盡管這里采用特定術(shù)語,但它們僅以一般和描述性意思使用,并且不是為了限制目的。
如下實驗例子描述在評估可以用來建立對于乳腺癌病人的預(yù)后的4個候選生物標(biāo)記和其可量化概括特征時本發(fā)明實施例的使用。它通過說明而不是通過限制而提供。
實驗例子用來建立乳腺癌預(yù)后的生物標(biāo)記(SLPI、p21ras、E2F1及src)組的評估引言根據(jù)這里包括的實驗例子,本發(fā)明的實施例可以用來評估生物標(biāo)記的組合,其過分表達(dá)對于為具有各種類型的乳腺癌的病人建立診斷和預(yù)后可能是有用的。在所附實驗例子的情況下,并且在本發(fā)明的其它實施例中,標(biāo)記組可以被評估,以確定最佳的基于順序的決定規(guī)則。由“乳腺癌”意指例如由活檢分類為惡性病理學(xué)的那些條件。乳腺癌診斷的臨床敘述在醫(yī)學(xué)技術(shù)中是熟知的。本領(lǐng)域的技術(shù)人員將認(rèn)識到,乳腺癌是指乳腺組織的任何惡性腫瘤,包括例如癌或肉瘤。在具體實施例中,乳腺癌是管癌原地(DCIS)、小葉癌原地(LCIS)、或粘蛋白癌。乳腺癌也指滲入管(IDC)或滲入小葉癌(ILC)。在本發(fā)明的大多數(shù)實施例中,感興趣的主題是懷疑有或?qū)嶋H診斷有乳腺癌的病人。
美國癌癥聯(lián)合委員會(AJCC)已經(jīng)開發(fā)了一種使用“TNM”分類方案用于乳腺癌分階段的標(biāo)準(zhǔn)化系統(tǒng)。估計病人的主要腫瘤尺寸(T)、區(qū)域淋巴結(jié)狀態(tài)(N)、及遠(yuǎn)距離轉(zhuǎn)移(M)的存在/缺乏,并且然后基于這種因素組合分類成階段0-IV。在這種系統(tǒng)中,主要腫瘤尺寸按0-4的刻度分類(T0=?jīng)]有主要腫瘤的跡象;T1=≤2cm;T2=>2cm-≤5cm;T3=>5cm;T4=直接擴展到胸壁或皮膚的任何尺寸的腫瘤)。淋巴結(jié)狀態(tài)分類為N0-N3(N0=區(qū)域淋巴結(jié)沒有轉(zhuǎn)移;N1=轉(zhuǎn)移到可運動的、同側(cè)腋生淋巴結(jié);N2=轉(zhuǎn)移到相互固定的同側(cè)淋巴結(jié)或轉(zhuǎn)移到其它結(jié)構(gòu);N3=轉(zhuǎn)移到在胸骨下面的同側(cè)淋巴結(jié))。轉(zhuǎn)移(metastasis)由遠(yuǎn)距離轉(zhuǎn)移的缺乏(M0)或存在而分類。盡管用來建立在任意臨床階段的乳腺癌病人的預(yù)后的標(biāo)記的評估由本發(fā)明所包容,但對用來建立在早期乳腺癌中的乳腺癌病人的預(yù)后的標(biāo)記的評估和優(yōu)化具有特別興趣。由“早期乳腺癌”意指階段0(原地乳腺癌)、I(T1、N0、M0)、IIA(T0-1、N1、M0或T2、N0、M0)、及IIB(T2、N1、M0或T3、N0、M0)。早期乳腺癌病人呈現(xiàn)很少或沒有淋巴結(jié)牽涉。如這里使用的那樣,“淋巴結(jié)牽涉”或“淋巴結(jié)狀態(tài)”是指癌癥是否已經(jīng)轉(zhuǎn)移到淋巴結(jié)。乳腺癌病人在這個基礎(chǔ)上分類為“淋巴結(jié)陽性”或“淋巴結(jié)陰性”。辨別乳腺癌病人和分段疾病的方法是熟知的,并且可以包括人工檢查、活檢、病人和/或家族史的回顧、及成像技術(shù),如乳房X射線攝影、磁共振成像(MRI)、及正電子放射層析X射線照片。
術(shù)語“預(yù)后(prognosis)”在本技術(shù)中被理解并包括關(guān)于乳腺癌的可能過程或乳腺癌進展的預(yù)測,特別是關(guān)于疾病緩解、疾病再現(xiàn)、腫瘤復(fù)發(fā)、轉(zhuǎn)移、及死亡的可能性。為了這里描述的例子的目的,“良好預(yù)后”是指患有乳腺癌的病人將保持免于疾病(即,免于癌癥)至少五年的可能性,而“不良預(yù)后”意指在少于五年內(nèi)潛在癌癥或腫瘤的再現(xiàn)或復(fù)發(fā)、轉(zhuǎn)移、或死亡的可能性。分類為具有“良好結(jié)果”的癌癥病人至少在五年內(nèi)保持免于潛在癌癥或腫瘤。相反,“不良結(jié)果”癌癥病人在五年內(nèi)經(jīng)歷疾病再現(xiàn)、腫瘤復(fù)發(fā)、轉(zhuǎn)移、或死亡。如這里使用的那樣,用來估計預(yù)后或無疾病存活時間的相關(guān)時間從腫瘤的手術(shù)去除或抑制、緩解、或腫瘤生長的禁止開始。
如這里以上描述的那樣,多個臨床和預(yù)后乳腺癌因素在本技術(shù)中是已知的,并且用來預(yù)測治療結(jié)果和疾病復(fù)發(fā)的可能性。這樣的因素包括淋巴結(jié)牽涉、腫瘤尺寸、組織學(xué)等級、雌激素和黃體酮激素受體狀態(tài)(ER/PR)、Her2/神經(jīng)鞘水平、及腫瘤倍性。使用本發(fā)明的方法,在建立早期乳腺癌病人的預(yù)后時使用的標(biāo)記和其特征的組合的評估能以系統(tǒng)化方式獨立于這些或其它臨床和預(yù)后因素的估計、或與其組合地完成。
本發(fā)明的方法允許候選生物標(biāo)記(和其特征)的系統(tǒng)評估,從而與其它已知預(yù)后指示符(例如,淋巴結(jié)牽涉、腫瘤尺寸、組織學(xué)等級、雌激素和黃體酮受體水平、Her2/神經(jīng)鞘狀態(tài)、腫瘤倍性、及家族史)的分析相比較,提供乳腺癌預(yù)后更優(yōu)越的估計。
乳腺癌由幾種可選擇的策略管理,這些策略包括例如手術(shù)、輻射療法、激素療法、化學(xué)療法、或其某種組合。如在本技術(shù)中已知的那樣,用于個別乳腺癌病人的治療決定可基于涉及的淋巴結(jié)的數(shù)量、雌激素和黃體酮受體狀態(tài)、主要腫瘤的尺寸、及在診斷下的疾病階段。在診斷時使用這里公開的方法把病人分層成不良預(yù)后或良好預(yù)后危險組可以提供額外的或替換的治療決定作用因素。本發(fā)明的方法允許用來把具有良好預(yù)后的那些乳腺癌病人與更可能經(jīng)歷復(fù)發(fā)的那些人(即,在診斷時可能需要額外主動治療或其從獲益的病人)區(qū)分開的候選生物標(biāo)記的分析和評估。本發(fā)明的方法在挑選適當(dāng)生物標(biāo)記、其特征、及特征閾值時特別有用,從而使在建立早期乳腺癌病人的更準(zhǔn)確預(yù)后時的候選生物標(biāo)記(或生物標(biāo)記組)的預(yù)后值最大化。如以上討論的那樣,在疾病早期所診斷的大多數(shù)乳腺癌病人在手術(shù)和/或輻射療法之后長期存活,而沒有進一步的額外療法。然而,這些病人中的顯著比例(近似20%)將經(jīng)受疾病復(fù)發(fā)或死亡,導(dǎo)致某些或全部早期乳腺癌病人應(yīng)該接收額外療法(例如,化學(xué)療法)的臨床推薦。本發(fā)明的方法用來評估可以更好強調(diào)這種高危險的、不良預(yù)后群的早期乳腺癌病人的生物標(biāo)記和其特征,并且由此確定哪些病人會從繼續(xù)的和/或更主動療法受益并密切監(jiān)視以后治療。
在這個實驗例子中,本發(fā)明的方法用來評估4個候選生物標(biāo)記(SLPI、p21ras、E2F1及src)組和與每個生物標(biāo)記相對應(yīng)的單一概括特征(使用圖像處理系統(tǒng)抽取)。該例子表示根據(jù)本發(fā)明一個實施例的最佳的基于順序決定規(guī)則的確定。在該例子中利用的特征涉及在由病理學(xué)家辨別為感興趣區(qū)域(ROI)的乳腺癌腫瘤區(qū)域中的1+、2+及3+細(xì)胞的百分比?;谶@些特征,為所選擇的標(biāo)記/特征組合使用最佳的基于順序決定規(guī)則(包括閾值和疾病規(guī)則)使靈敏性和特異性對最大化。
材料和方法
在這個實驗例子中,超過200位病人被分析,以便評估和優(yōu)化用來建立乳腺癌預(yù)后的不同標(biāo)記和特征組合。如在表4中概括的那樣,這群病人十分相異,并且呈現(xiàn)范圍從T1N0至T3N0不同階段的腫瘤。病人的目標(biāo)特性是他們的良好結(jié)果或不良結(jié)果狀態(tài)。良好結(jié)果病人是在五年后仍然免于疾病的那些人;不良結(jié)果病人定義為在五年內(nèi)復(fù)發(fā)或死亡的病人。身體樣本和其對應(yīng)取得的切片從每個病人取得,以便提供具有已知結(jié)果的身體樣本,從而如以上描述的那樣為每個可能標(biāo)記/特征/閾值組合可確定特異性和靈敏性對。
來自研究(來自在表4中概述的同一病人群)的身體樣本然后暴露于4個生物標(biāo)記組(見表5),并且對應(yīng)切片被產(chǎn)生,以便使標(biāo)記切片經(jīng)受本發(fā)明的方法。如下步驟強調(diào)本發(fā)明的方法,它應(yīng)用在這個實驗例子中(1)對于表示最好質(zhì)量染劑的每個標(biāo)記優(yōu)化彩色基因分離(根據(jù)‘446申請和‘729申請的彩色基因分離方法);(2)對于每個標(biāo)記根據(jù)其亞細(xì)胞定位定制分段設(shè)立;見表1(細(xì)胞核、細(xì)胞質(zhì)或細(xì)胞膜)。(也見在附屬的示范特征的附錄中強調(diào)的NUCL、CYTO、及MEMB特征);及(3)特征在限定的ROI內(nèi)在細(xì)胞、視場(FOV)及焦點水平下抽取,并且輸出到輸出文件(XML格式)。
根據(jù)本發(fā)明一個實施例的特定計算機程序產(chǎn)品(在這個例子中命名為“多標(biāo)記分析器”)然后用來完成標(biāo)記組合的評估和優(yōu)化。根據(jù)一個實施例,計算機程序產(chǎn)品構(gòu)造成能夠加載使用顯微鏡法產(chǎn)生的組織顯微陣列(TMA)或組織截面XML文件的全部或一部分,以使用描述TMA密鑰的XML文件(在TMA分析的情況下)或給出病人臨床狀態(tài)和病人評估的Excel文件(在組織截面分析的情況下)合并在這些文件中包含的數(shù)據(jù),并且所有都進一步分析。這個合并過程與對于每個身體樣本(與每個病人相對應(yīng))經(jīng)顯微鏡法抽取的特征與在關(guān)于病人的TMA密鑰(或Excel文件)中保持的信息相關(guān)聯(lián)地包括標(biāo)識號和醫(yī)療狀態(tài)(包括良好或不良結(jié)果)及病理學(xué)家評估,如果它不包括在XML格式化文件中。
表5列出在這個例子中評估的標(biāo)記(SLPI、p21ras、E2F1及src)和對于每個標(biāo)記類型抽取的對應(yīng)CELL_PERCENT概括特征(這個例子表示用于四個標(biāo)記的基于順序的決定規(guī)則的建立,其中單一標(biāo)記/單一特征閾值被分析,以確定最佳的基于順序決定規(guī)則)。所述決定規(guī)則使用在圖1中概述的本發(fā)明的方法創(chuàng)建,其中預(yù)測預(yù)后(對于標(biāo)記的每種可能順序),其中每個標(biāo)記或者是“on”(1)或者是“off”(0)。為了確定對每個特定標(biāo)記評估的特征的閾值(見表5),每個可能閾值量(從0至100%)被分析,并且與在研究中的各種病人(從這些病人取得用于例子的身體樣本)的結(jié)果相比較。例如,表5表示與E2F1標(biāo)記相對應(yīng)的CELL_PERCENT_2的分布曲線。該曲線圖表示作為CELL_PERCENT_2值的函數(shù)的不良結(jié)果病人的分布520和良好結(jié)果病人的分布510。如在圖5中表示的那樣,在2-3百分比極限以上,不良結(jié)果病人(520)比良好結(jié)果病人(510)顯著地更頻繁。使用2.46%的閾值550,僅借助于E2F1標(biāo)記用作預(yù)后指示符,分別給出0.54和0.75的靈敏性和特異性。表5的列3表示為E2F1標(biāo)記從圖5中的數(shù)據(jù)確定的生成決定規(guī)則(它包括對E2F1的2.46%的閾值和疾病規(guī)則(如果大于2.46%CELL_PERCENT_2則為“on”))。
候選預(yù)后(與順序的每種可能組合相對應(yīng))被產(chǎn)生,并且然后與對于使用圖2中的象限系統(tǒng)評估的身體樣本的每一個的實際結(jié)果相比較,以便確定真實陽性210、虛假陽性220、虛擬陰性230及真實陰性240的數(shù)量。如以上詳細(xì)描述的那樣,一旦在適當(dāng)象限中畫出,就計算與每個可能決定規(guī)則相對應(yīng)的特異性和靈敏性值(這樣的計算的結(jié)果表示在表6中)。由表6的數(shù)據(jù)確定的基于順序的決定規(guī)則可按如下讀出如果E2F1是ON(即1)并且不僅一個標(biāo)記是ON,那么病人被當(dāng)作不良結(jié)果,否則被當(dāng)作良好結(jié)果。
結(jié)果對具有在表5中定義的閾值和決定規(guī)則的SLPI、p21ras、E2F1及src僅使用一個百分比特征,在這個樣本集上使用更簡單的基于順序的決定規(guī)則達(dá)到60%靈敏性和80%特異性如果E2F1是ON(即1)并且不僅一個標(biāo)記是ON,那么對于病人的最佳預(yù)后是不良結(jié)果。
因此,否則對于病人的預(yù)后是良好結(jié)果。
如上所述,僅基于E2F1的預(yù)后決定規(guī)則分別給出54%和75%的靈敏性和特異性。然而,當(dāng)E2F1是ON并且SLPI、p21ras或src是ON時使用基于解釋的標(biāo)記組合,導(dǎo)致60%靈敏性和80%特異性(使用表6的結(jié)果定義的基于順序的決定算法)。
附錄示范特征如下特征指示可量化特征的類型,這些可量化特征可以使用與例如諸如計算機裝置之類的控制器通信的成像系統(tǒng)或視頻顯微鏡法系統(tǒng)從身體樣本(如染色組織學(xué)切片或細(xì)胞學(xué)切片)的圖像抽取。此外,如下特征可以使用這里描述的計算程序產(chǎn)品的實施例被抽取和/或計算。在某些實施例中,如下特征可以復(fù)合和/或組合,從而建造可以由臨床醫(yī)師更容易利用的概括特征,以量化可與用于特定疾病的預(yù)后指示符相對應(yīng)的值,該疾病可以鏈接到特定目標(biāo)分子的過分表達(dá)(及所得到的染料染色)。
應(yīng)該理解,如下特征附錄通過說明而不是通過限制而提供。本領(lǐng)域的技術(shù)人員將認(rèn)識到,其它特征可能是有益的,并且可以抽取和分析,從而使用本發(fā)明的方法和計算機程序產(chǎn)品實施例評估一個或幾個標(biāo)記。
A.形狀描述符特征1.面積這是在斑點中的前景象素(foreground pixel)的數(shù)量(未計數(shù)孔),該掩模(二進制表示)是M。當(dāng)象素到微米的對應(yīng)可用(k)時,它代表在切片上的斑點(M)的物理面積(微米2)。如果象素到微米(k)的物理對應(yīng)不可用,則AREA是測量象素的數(shù)量(k=1)。
面積=k2×∑p∈Ep (9)其中E={p|p∈M}范圍是
]>如果p Interior并且p是角(Corner),那么q(np)=而且,q(np)=4-∑(t,l,r,b)范圍是
。
3.MINFERET這是最小Feret直徑(配合物體的矩形箱的最小約束直徑,在檢查一定數(shù)量的角度后求出)。當(dāng)象素到微米的對應(yīng)可用(k)時,它代表在切片上的斑點(M)的物理Min Feret直徑(微米)。如果象素到微米的物理對應(yīng)不可用(k=1)。
范圍是[0,∝[。
4.MAXFERET這是最大Feret直徑(配合物體的矩形箱的最大約束直徑,在檢查一定數(shù)量的角度后求出)。當(dāng)象素到微米的對應(yīng)可用(k)時,它代表在切片上的斑點(M)的物理Max Feret直徑(微米)。如果象素到微米的物理對應(yīng)不可用(k=1)。
范圍是
。
5.緊湊性這個值是用于圓(1.0)的最小值,并且從周長(P)和面積(A)導(dǎo)出。形狀越盤旋,值越大。
范圍是
。
6.粗糙度這是斑點如何粗糙的度量,并且等于周長除以凸起周長(Pc)。
光滑凸起物體將具有1.0的最小粗糙度 范圍是
。
7.拉長這個值等于真實長度/寬度。它應(yīng)該用于細(xì)長物體。
范圍是
。
B.直方圖描述符特征1.SUMSUM是所有個別象素分?jǐn)?shù)的總和。
對于透射率和對于光學(xué)密度,范圍是
。
2.平均值算術(shù)平均值是通常叫做平均值的值當(dāng)該詞“平均值”使用而沒有修飾時,假定它是指算術(shù)平均值。平均值是所有分?jǐn)?shù)的總和除以分?jǐn)?shù)的數(shù)量。平均值用于大致對稱分布的中心趨勢的良好度量,但在偏斜分布中誤導(dǎo),因為它可受極值分?jǐn)?shù)的巨大影響。因此,諸如中值之類的其它統(tǒng)計數(shù)字對于諸如常常是非常偏斜的反應(yīng)時間或家庭收入之類的分布可能更有益。
分?jǐn)?shù)與其平均值的方差之和小于其與任何其它數(shù)的方差。
對于正態(tài)分布,平均值是最高效的,并因此最少經(jīng)受中心趨勢所有度量的樣本波動。
使N=Σi=0255h(i)]]>對于透射率范圍是
對于光學(xué)密度,范圍是
。
3.MIN
最小值是分布的最小值。
對于透射率范圍是
對于光學(xué)密度,范圍是
。
4.Q1Q1是分布的第25個百分之一。25%的分?jǐn)?shù)在Q1以下,并且75%的分?jǐn)?shù)在Q1以上。
Q1=i|{Σj=0j<ih(i)<N4,Σj=0j<=ih(i)≥N4}---(16)]]>使N=Σi=0255h(i)]]>對于透射率范圍是
對于光學(xué)密度,范圍是
。
5.中值中值是分布的中點分?jǐn)?shù)的一半高于中值,并且一半在中值下面。中值對于極值分?jǐn)?shù)不如平均值敏感,并且這使得它對于高度偏斜分布是比平均值更好的度量。
每個數(shù)與中值的絕對偏差的和小于絕對偏差與任何其它數(shù)的和。
平均值、中值、及模型在對稱分布中相等。平均值在正偏斜分布中高于中值,并且在負(fù)偏斜分布中小于中值 使N=Σi=0255h(i)]]>對于透射率范圍是
對于光學(xué)密度,范圍是
。
6.Q3Q3是分布的第75個百分之一。75%的分?jǐn)?shù)在Q3以下,并且25%的分?jǐn)?shù)在Q3以上。
Q3=i|{Σj=0j<ih(i)<N×34,Σj=0j<=ih(i)≥N×34}---(18)]]>
使N=Σi=0255h(i)]]>對于透射率范圍是
對于光學(xué)密度,范圍是
。
7.MAX最大值是分布的最大值。
對于透射率范圍是
對于光學(xué)密度,范圍是
。
8.縱數(shù)縱數(shù)(mode)是在分布中最頻繁出現(xiàn)的分?jǐn)?shù),并且用作中心趨勢的度量??v數(shù)作為中心趨勢的度量的優(yōu)點是顯然的。而且,它是可與名義數(shù)據(jù)一起使用的中心趨勢的唯一度量。
縱數(shù)大大地經(jīng)受樣本波動,并因此不推薦用作為中心趨勢的唯一度量??v數(shù)的另外缺點是多種分布具有多于一個縱數(shù)。這些分布叫做“多縱數(shù)”。
在正態(tài)分布中,平均值、中值、及縱數(shù)相同。
對于透射率范圍是
對于光學(xué)密度,范圍是
。
9.三值平均值三值平均值通過把第25個百分之一+兩倍的第50個百分之一(中值)+第75個百分之一求和并且除以四而計算。
三值平均值幾乎與中值一樣抵抗極值分?jǐn)?shù),并且在偏斜分布中比算術(shù)平均值經(jīng)受較小的樣本波動。它對于正態(tài)分布不如平均值高效。
對于透射率范圍是
對于光學(xué)密度,范圍是
。
10.修正平均值50
修正平均值通過丟棄最低和最高分?jǐn)?shù)的一定百分比并且然后計算剩余分?jǐn)?shù)的平均值而計算。修正50%的平均值通過丟棄分?jǐn)?shù)的較低和較高25%并且取剩余分?jǐn)?shù)的平均值而計算。中值是修正100%的平均值,并且算術(shù)平均值是修正0%的平均值。
修正平均值顯然對極值分?jǐn)?shù)不如算術(shù)平均值敏感。它因此對于偏斜分布對取樣波動不如平均值敏感。它對于正態(tài)分布不如平均值高效 對于透射率范圍是
對于光學(xué)密度,范圍是
。
11.范圍范圍是散布或分散的最簡單度量它等于最大與最小值之差。范圍能是散布的有用度量,因它如此容易理解。然而,它對于極值分?jǐn)?shù)非常敏感,因它僅基于兩個值。范圍幾乎永遠(yuǎn)不應(yīng)該用作散布的唯一度量,但如果用作對于諸如標(biāo)準(zhǔn)偏差或半內(nèi)四分距之類的其它散布度量的補充,則能是有益的。
范圍=最大值-最小值 (23)對于透射率范圍是
對于光學(xué)密度,范圍是
。
12.半內(nèi)四分距半內(nèi)四分距(semi-interquartile range)是散布或分散的單度量。它作為在第75個百分之一[常常叫做(Q3)]與第25個百分之一(Q1)之差的一半而計算。
由于在分布中的一半分?jǐn)?shù)位于Q3與Q1之間,所以半內(nèi)四分距是需要覆蓋1/2分?jǐn)?shù)的1/2距離。在對稱分布中,從中值以下的一個半內(nèi)四分距伸展到中值以上的一個半內(nèi)四分距的間隔將包含分?jǐn)?shù)的1/2。然而,對于偏斜分布情況不是這樣。
半內(nèi)四分距受極值分?jǐn)?shù)的影響很小,所以它對于偏斜分布是散布的良好度量。然而,它在正態(tài)分布中比標(biāo)準(zhǔn)偏差經(jīng)受更大的樣本波動,并因此常常不用于近似正態(tài)分布的數(shù)據(jù)。
對于透射率范圍是
對于光學(xué)密度,范圍是
。
13.方差方差是分布如何散開的度量。它作為每個數(shù)與其平均值的均方差而計算。
范圍是
14.STDEV這種特征估計基于樣本的標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差是值與平均值(均值)分散如何廣的度量。標(biāo)準(zhǔn)偏差是方差的平方根。它是散布的最常用度量。
盡管對于極值分?jǐn)?shù)不如范圍敏感,但標(biāo)準(zhǔn)偏差比半內(nèi)四分距更敏感。因而,當(dāng)極值分?jǐn)?shù)的可能性存在時,半內(nèi)四分距應(yīng)該補充標(biāo)準(zhǔn)偏差。
Stdev=nΣx2-(Σx)2n(n-1)---(26)]]>范圍是
。
15.偏斜(SKEW)這種特征返回分布的偏斜性。偏斜性特征化分布繞其平均值的非對稱性程度。分布如果其尾部之一大于其它尾部則是偏斜的。正偏斜性指示使非對稱尾部向更大正值延伸的分布。負(fù)偏斜性指示使非對稱尾部向更大負(fù)值延伸的分布。
范圍是[-∝,+∝]使S是樣本標(biāo)準(zhǔn)偏差16.峰態(tài)(KURTOSIS)
這種特征返回數(shù)據(jù)集的峰態(tài)。峰態(tài)特征化分布與正態(tài)分布相比較的相對峰度或平度。正峰態(tài)指示較尖的分布。負(fù)峰態(tài)指示較平的分布。峰態(tài)基于分布的尾部的尺寸。
范圍是[-∝,+∝]S是樣本標(biāo)準(zhǔn)偏差。
C.透射率和光學(xué)密度特征(TRANS、OD、及其它)1.TRANS-透射率透射率是由透明物體透射的總輻射或光通量與入射通量的比值,通常對于正交入射給出。
Trans=IIo---(29)]]>范圍是
在圖像內(nèi),透射率對于8位離散化,導(dǎo)致在
范圍內(nèi)的256個值。如果基礎(chǔ)計算基于這樣的離散值,則計算特征無論如何表達(dá)在
的范圍內(nèi),從0%至100%的透射率。
Trans255=255I255Io|255,
---(30)]]>2.OD-光學(xué)密度光學(xué)密度與透射率相關(guān),作為其對數(shù)的負(fù)值。在在圖像內(nèi),透射率對于8位離散化,導(dǎo)致在
范圍內(nèi)的256個值。
OD=-log10(Trans)=log10(I0I)---(31)]]>由于透射率的8位離散化,范圍是
。
臨時OD圖像緩沖器也是離散緩沖器。
OD255=k×log10(I0|255I255)=k×log10(255I255),
---(32)]]>
使k=255log10(255),OD255(Trans255(0))=OD255(Trans255(1))]]>如果基礎(chǔ)計算基于這樣的離散值,則計算特征無論如何根據(jù)范圍從0到無窮大(理論上)的真實OD值表達(dá),在實際中由于8位約束形成到2.4065的上限。
3.亮度和染料特征(LUMIN、DYE1、DYE2、DYE3)對于透射率或光學(xué)密度直方圖計算的直方圖特征反映在解出用于象素(R、G、B)值的彩色基因模型之后計算的感興趣圖像或Dye的亮度(“LUMIN”)。RGB彩色基因分離模型例如在‘446申請和‘729申請中描述。
LUNIN(Y)=0.299R0.587G+0.114B 常規(guī)浮點公式(33)LUNIN(Y)=[(9798R+19235G+3736B)/32768]由代碼使用的公式(34)注意彩色基因誤差、染料置信度當(dāng)解出時,RGB彩色基因分離模型評估重新建造誤差,該誤差是在RGB空間內(nèi)在象素的輸入RGB值與基于來自每種染料影響的RGB值的重新建造的重新計算RGB值之間的歐幾里得距離。這種誤差對于報告的感興趣物體的每一個和每個象素使用以上提到的RGB彩色基因分離模型的方法和設(shè)備可評估。
依據(jù)當(dāng)獲得進行陰影校正和圖像標(biāo)準(zhǔn)化使用的白色基準(zhǔn)圖像時對于在光學(xué)系統(tǒng)內(nèi)記錄的每個RGB值和噪聲水平(NOISE)測量的彩色基因誤差,對于每種染料基于對于這個象素評估的透射率不會統(tǒng)計地改變大于區(qū)分不同透射率的人眼能力的概率而計算置信度。
D.層次描述符特征當(dāng)計算與在切片(如組織學(xué)切片)內(nèi)的不同層次物體(如細(xì)胞、細(xì)胞膜、細(xì)胞核/或其它物體)或切片的圖像相關(guān)的特征時,關(guān)于如下層次的基準(zhǔn)字段可以評估特征與物體相關(guān)的切片(SLIDE)、焦點(FOCUS)、視場(FOV)或細(xì)胞(CELL)。
·切片“SLIDE”、及相關(guān)的“FOCUS”、“FOV”、“CELL”
·焦點“FOCUS”、及相關(guān)的“FOV”、“CELL”·視場“FOV”、和相關(guān)的“CELL”·細(xì)胞“CELL”E.細(xì)胞描述符特征當(dāng)計算細(xì)胞特征時,所述特征反映在如下細(xì)胞或亞細(xì)胞地點的一個或多個中整個細(xì)胞(CELL)、細(xì)胞核(NUCL)、細(xì)胞質(zhì)(CYTO)或細(xì)胞膜(MEMB)。
·整個細(xì)胞“CELL”·細(xì)胞核“NUCL”·細(xì)胞質(zhì)“CYTO”·細(xì)胞膜“MEMB”表格附錄表1示范標(biāo)記的清單及其相應(yīng)亞細(xì)胞地點。
表2用于得到類別1、2或3的所選擇細(xì)胞的疾病的分配器設(shè)置。
表3百分比概括特征。
表4身體樣本從其取得的病人的描述和結(jié)果(實驗例子)。
表5用于實驗例子的百分比概括特征(表示對于基于順序的決定規(guī)則確定的閾值)。
表6對于來自實驗例子的SLPI、p21ras、E2F1及SRC組合使用順序解釋手段的靈敏性和特異性對(順序S0110必須按如下讀出SLPI=OFF/p21ras=ON/E2F1=ON/src=OFF。)
表7生成用于良好結(jié)果病人的X2值(X2Good)和用于不良結(jié)果病人的X2值(X2Bad)的X2分析公式的細(xì)節(jié)。
在說明書中提到的所有公報和專利申請指示本發(fā)明所屬領(lǐng)域的技術(shù)人員的水平。所有公報和專利申請這里通過參考包括到相同程度,就像每個個別公報或?qū)@暾埫鞔_和個別地指示成通過參考包括。
盡管以上發(fā)明為了理解清楚的目的已經(jīng)通過說明和例子比較詳細(xì)地描述,但顯然,在附屬實施例的范圍內(nèi)可以實施一定變更和修改。
權(quán)利要求
1.一種用來分析至少一個標(biāo)記以確定癌癥病人的預(yù)后的方法,所述方法包括把身體樣本暴露于所述至少一個標(biāo)記,所述身體樣本從所述癌癥病人取得;使用圖像處理系統(tǒng)從至少一個切片的取得圖像抽取至少一個可量化特征,所述至少一個切片從所述身體樣本制備;把決定規(guī)則應(yīng)用于所述至少一個可量化特征,從而基于所述至少一個可量化特征與所述決定規(guī)則之間的關(guān)系確定所述癌癥病人的預(yù)后。
2.根據(jù)權(quán)利要求1所述的方法,其中所述應(yīng)用步驟還包括把閾值應(yīng)用于所述至少一個可量化特征,從而基于所述至少一個可量化特征與所述閾值之間的關(guān)系確定所述癌癥病人的預(yù)后。
3.根據(jù)權(quán)利要求2所述的方法,其中所述應(yīng)用步驟還包括為所述閾值應(yīng)用疾病規(guī)則,所述疾病規(guī)則能夠建立對應(yīng)于與所述閾值相關(guān)的所述至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
4.根據(jù)權(quán)利要求1所述的方法,其中所述抽取步驟還包括辨別感興趣區(qū)域,從該感興趣區(qū)域抽取所述至少一個可量化特征,所述感興趣區(qū)域在使用圖像處理系統(tǒng)取得的所述至少一個切片的圖像內(nèi)。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個標(biāo)記從包括如下的組中選擇色度生物標(biāo)記;SLPI;PSMB9;NDRG-1;Muc-1;phospho-p27;src;E2F1;p21ras;p53;及其組合。
6.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個可量化特征從包括如下的組中選擇透射率;光學(xué)密度;細(xì)胞形態(tài);以標(biāo)記強度和細(xì)胞形狀為特征的細(xì)胞類型的百分比;及其組合。
7.一種計算機程序產(chǎn)品,能夠控制圖像處理系統(tǒng)以分析確定癌癥病人的預(yù)后的至少一個標(biāo)記,所述計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)具有其中存儲的計算機可讀程序代碼部分,所述計算機可讀程序代碼部分包括用來使用圖像處理系統(tǒng)從至少一個切片的取得圖像中抽取至少一個可量化特征的可執(zhí)行部分,所述至少一個切片由從癌癥病人取得的身體樣本制備,所述身體樣本暴露于所述至少一個標(biāo)記;及用來把決定規(guī)則應(yīng)用于所述至少一個可量化特征的可執(zhí)行部分,從而基于所述至少一個可量化特征與所述決定規(guī)則之間的關(guān)系確定癌癥病人的預(yù)后。
8.根據(jù)權(quán)利要求7所述的計算機程序產(chǎn)品,其中所述用于應(yīng)用的可執(zhí)行部分還包括用來把閾值應(yīng)用于所述至少一個可量化特征的可執(zhí)行部分,從而基于所述至少一個可量化特征與閾值之間的關(guān)系確定癌癥病人的預(yù)后。
9.根據(jù)權(quán)利要求8所述的計算機程序產(chǎn)品,其中所述用于應(yīng)用的可執(zhí)行部分還包括用來應(yīng)用用于所述閾值的疾病規(guī)則的可執(zhí)行部分,所述疾病規(guī)則能夠建立對應(yīng)于與所述閾值相關(guān)的所述至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
10.一種用來評估適于確定癌癥病人的預(yù)后的至少一個標(biāo)記的方法,所述方法包括把多個身體樣本暴露于所述至少一個標(biāo)記,所述多個身體樣本從對應(yīng)的多個病人取得,每個病人具有已知結(jié)果;使用圖像處理系統(tǒng)從多個切片的每一個的取得圖像抽取至少一個可量化特征,所述多個切片從與每個病人相對應(yīng)的所述多個身體樣本制備;把多個候選決定規(guī)則應(yīng)用于所述多個切片的每一個的所述至少一個可量化特征,從而為所述多個候選決定規(guī)則和所述至少一個可量化特征的多種組合的每一種提供候選預(yù)后;及對于所述至少一個可量化特征,選擇與最佳預(yù)后相對應(yīng)的最佳決定規(guī)則,最佳決定規(guī)則從候選決定規(guī)則中選擇,所述最佳決定規(guī)則提供了用于多個切片的每一個的最佳預(yù)后最佳地與所述多個病人的每一個的已知結(jié)果相對應(yīng)。
11.根據(jù)權(quán)利要求10所述的方法,其中所述應(yīng)用步驟還包括把多個候選閾值應(yīng)用于所述至少一個可量化特征,從而產(chǎn)生與用于多個身體樣本每一個的多個候選閾值的每一個相對應(yīng)的多個候選預(yù)后,并且其中所述選擇步驟還包括從所述多個候選閾值中選擇最佳閾值,從而用于多個切片的每一個的最佳預(yù)后最佳地與所述多個病人的每一個的已知結(jié)果相對應(yīng)。
12.根據(jù)權(quán)利要求11所述的方法,其中所述應(yīng)用步驟還包括確定用于多個候選閾值的每一個的疾病規(guī)則,所述疾病規(guī)則能夠建立對應(yīng)于與多個候選閾值的每一個相關(guān)的所述至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
13.根據(jù)權(quán)利要求10所述的方法,其中所述選擇步驟還包括確定與多個候選決定規(guī)則的每一個相對應(yīng)的多個特異性和靈敏性對;在接收器操作特性曲線上畫出所述多個特異性和靈敏性對;計算在所述多個特異性和靈敏性對的每一對與最佳特異性和靈敏性對之間的多個歐幾里得距離;及選擇對應(yīng)于具有到所述最佳特異性和靈敏性對的最小歐幾里得距離的特異性和靈敏性對的最佳決定規(guī)則。
14.根據(jù)權(quán)利要求10所述的方法,其中所述抽取步驟還包括辨別感興趣區(qū)域,從該感興趣區(qū)域抽取所述至少一個可量化特征,所述感興趣區(qū)域在使用圖像處理系統(tǒng)取得的多個切片的每一個的圖像內(nèi)。
15.根據(jù)權(quán)利要求10所述的方法,還包括評估所述至少一個標(biāo)記的統(tǒng)計獨立性,從而保證所述至少一個標(biāo)記能夠提供基本統(tǒng)計地獨立于至少一個互補標(biāo)記的預(yù)后。
16.根據(jù)權(quán)利要求15所述的方法,其中所述評估步驟還包括把觀察結(jié)果的頻率分布與理論預(yù)后的頻率分布相比較,其中假定所述至少一個標(biāo)記獨立于用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第一多個身體樣本的額外標(biāo)記而計算該理論預(yù)后,所述第一多個身體樣本與具有已知良好結(jié)果的病人相對應(yīng);把觀察結(jié)果的頻率分布與理論預(yù)后的頻率分布相比較,其中假定所述至少一個標(biāo)記獨立于用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第二多個身體樣本的額外標(biāo)記而計算該理論預(yù)后,所述第二多個身體樣本與具有已知不良結(jié)果的病人相對應(yīng);估計所述至少一個標(biāo)記相對于所述至少一個互補標(biāo)記的獨立性。
17.根據(jù)權(quán)利要求16所述的方法,其中所述估計步驟還包括使用卡平方分析估計所述至少一個標(biāo)記相對于所述至少一個互補標(biāo)記的獨立性。
18.根據(jù)權(quán)利要求10所述的方法,其中所述至少一個標(biāo)記從包括如下的組中選擇色度生物標(biāo)記;SLPI;PSMB9;NDRG-1;Muc-1;phospho-p27;src;E2F1;p21ras;p53;及其組合。
19.根據(jù)權(quán)利要求10所述的方法,其中所述至少一個可量化特征從包括如下的組中選擇透射率;光學(xué)密度;細(xì)胞形態(tài);以標(biāo)記強度和細(xì)胞形狀為特征的細(xì)胞類型的百分比;及其組合。
20.一種計算機程序產(chǎn)品,能夠控制圖像處理系統(tǒng),以評估適于確定癌癥病人的預(yù)后的至少一個標(biāo)記,所述計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)具有其中存儲的計算機可讀程序代碼部分,所述計算機可讀程序代碼部分包括用來使用圖像處理系統(tǒng)從多個切片的每一個的取得圖像中抽取至少一個可量化特征的可執(zhí)行部分,所述多個切片由從對應(yīng)多個病人取得的多個身體樣本制備,每個病人具有已知結(jié)果,所述多個身體樣本暴露于所述至少一個標(biāo)記;用來把窮盡的多個候選決定規(guī)則應(yīng)用于多個切片的每一個的所述至少一個可量化特征的可執(zhí)行部分,從而提供用于所述窮盡的多個候選決定規(guī)則和所述至少一個可量化特征的多種組合的每一種的候選預(yù)后;及用來對所述至少一個可量化特征,選擇與最佳預(yù)后相對應(yīng)的最佳決定規(guī)則的可執(zhí)行部分,所述最佳塊定規(guī)則從所述候選決定規(guī)則中選擇,所述最佳決定規(guī)則提供了用于所述多個切片的每一個的最佳預(yù)后最佳地與所述多個病人的每一個的已知結(jié)果相對應(yīng)。
21.根據(jù)權(quán)利要求20所述的計算機程序產(chǎn)品,其中所述用于應(yīng)用的可執(zhí)行部分還包括用來把多個候選閾值應(yīng)用于所述至少一個可量化特征的可執(zhí)行部分,從而對于多個身體樣本的每一個產(chǎn)生與多個候選閾值的每一個相對應(yīng)的多個候選預(yù)后,并且其中所述用來選擇的可執(zhí)行部分還包括用來從多個候選閾值選擇最佳閾值的可執(zhí)行部分,從而用于多個切片的每一個的最佳預(yù)后最佳地與多個病人的每一個的已知結(jié)果相對應(yīng)。
22.根據(jù)權(quán)利要求21所述的計算機程序產(chǎn)品,其中所述用來應(yīng)用多個候選閾值的可執(zhí)行部分還包括用來確定用于多個候選閾值的每一個的疾病規(guī)則的可執(zhí)行部分,所述疾病規(guī)則能夠建立對應(yīng)于與多個候選閾值的每一個相關(guān)的所述至少一個可量化特征的值的良好預(yù)后或不良預(yù)后。
23.根據(jù)權(quán)利要求20所述的計算機程序產(chǎn)品,其中所述用于選擇步驟的可執(zhí)行部分還包括用來確定與窮盡的多個候選決定規(guī)則的每一個相對應(yīng)的多個特異性和靈敏性對的可執(zhí)行部分;用來在接收器操作特性曲線上畫出所述多個特異性和靈敏性對的可執(zhí)行部分;用來計算在所述多個特異性和靈敏性對的每一個與最佳特異性和靈敏性對之間的多個歐幾里得距離的可執(zhí)行部分;及用來選擇對應(yīng)于具有到所述最佳特異性和靈敏性對的最小歐幾里得距離的特異性和靈敏性對的最佳決定規(guī)則的可執(zhí)行部分。
24.根據(jù)權(quán)利要求20所述的計算機程序產(chǎn)品,其中所述用于抽取的可執(zhí)行部分還包括用來辨別感興趣區(qū)域的可執(zhí)行部分,從該感興趣區(qū)域抽取所述至少一個可量化特征,所述感興趣區(qū)域在使用圖像處理系統(tǒng)取得的多個切片的每一個的圖像內(nèi)。
25.根據(jù)權(quán)利要求20所述的計算機程序產(chǎn)品,還包括用來評估所述至少一個標(biāo)記的統(tǒng)計獨立性的可執(zhí)行部分,從而保證所述至少一個標(biāo)記能夠提供基本統(tǒng)計地獨立于至少一個互補標(biāo)記的預(yù)后。
26.根據(jù)權(quán)利要求25所述的計算機程序產(chǎn)品,其中所述用于評估的可執(zhí)行部分還包括用來把觀察結(jié)果的頻率分布與用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第一多個身體樣本的理論預(yù)后的頻率分布相比較的可執(zhí)行部分,所述第一多個身體樣本與具有已知良好結(jié)果的病人相對應(yīng);用來把觀察結(jié)果的頻率分布與用于暴露于所述至少一個標(biāo)記和所述至少一個互補標(biāo)記的第二多個身體樣本的理論預(yù)后的頻率分布相比較的可執(zhí)行部分,所述第二多個身體樣本與具有已知不良結(jié)果的病人相對應(yīng);用來估計所述至少一個標(biāo)記相對于所述至少一個互補標(biāo)記的獨立性的可執(zhí)行部分。
27.根據(jù)權(quán)利要求26所述的計算機程序產(chǎn)品,其中所述用于估計的可執(zhí)行部分還包括用來使用卡平方分析估計所述至少一個標(biāo)記相對于所述至少一個互補標(biāo)記的獨立性的可執(zhí)行部分。
全文摘要
提供用來評估和優(yōu)化在建立對于患有疾病的病人的預(yù)后時使用的一個或多個標(biāo)記的方法和計算機程序產(chǎn)品。更具體地說,所述方法包括步驟用來系統(tǒng)地評估可從已經(jīng)暴露于一個或多個生物標(biāo)記的身體樣本(如組織學(xué)切片)的圖像抽取的多個特征,以便基于一個或多個抽取特征建立預(yù)后決定規(guī)則,從而決定規(guī)則產(chǎn)生是最佳地預(yù)測實際病人結(jié)果的預(yù)后。因而,所述提供的方法和計算機程序產(chǎn)品產(chǎn)生最佳預(yù)測預(yù)后,以幫助臨床醫(yī)師開發(fā)用于有效病人護理管理的策略。
文檔編號G06F19/00GK101061480SQ200580039170
公開日2007年10月24日 申請日期2005年9月22日 優(yōu)先權(quán)日2004年9月22日
發(fā)明者拉斐爾·馬塞爾波利, 克拉克·梅里爾·懷特黑德, 蒂莫西·J.·費希爾 申請人:三路影像公司