專利名稱:確定用于從臨床數(shù)據(jù)獲得的標(biāo)識(shí)的可靠性指標(biāo)的方法和該可靠性指標(biāo)用于支持一個(gè)標(biāo)識(shí) ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于確定可靠性指標(biāo)的方法和設(shè)備,該可靠性指標(biāo)用于根據(jù)從樣本群收集的臨床數(shù)據(jù)而獲得的至少一組標(biāo)識(shí)(Signature),這些標(biāo)識(shí)是通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性而獲得的,其中每個(gè)標(biāo)識(shí)生成將樣本群分層的第一組分層值。
背景技術(shù):
為了臨床應(yīng)用的目的,高吞吐量的分子測(cè)量經(jīng)常經(jīng)過分析以識(shí)別出有助于對(duì)生物樣本分層的數(shù)據(jù)集中的模式。一種這樣的應(yīng)用是例如從基因表達(dá)數(shù)據(jù)選擇特征子集,該特征子集可以被用作特定類別的患者的診斷標(biāo)識(shí)。這種診斷標(biāo)識(shí)可以用于疾病、疾病病期和/ 或治療選擇(例如針對(duì)某些疾病的治療方案的肯定和否定響應(yīng))的臨床診斷。應(yīng)當(dāng)注意,在發(fā)現(xiàn)這樣的標(biāo)識(shí)期間患者的臨床狀態(tài)典型地是已知的。該“地面實(shí)況”通常作為臨床研究的一部分(從中獲得樣本)而可獲得,或者可以通過使用分子測(cè)量而不是用于標(biāo)識(shí)發(fā)現(xiàn)(例如DNA甲基化作用、蛋白質(zhì)組學(xué)和SNP)的測(cè)量來檢測(cè)某種分子特性來獲悉“地面實(shí)況”。將多種統(tǒng)計(jì)的和機(jī)器學(xué)習(xí)算法應(yīng)用到這樣的數(shù)據(jù)集以便發(fā)現(xiàn)在這些測(cè)量中的用于診斷(即, 可用于區(qū)分臨床狀態(tài))的模式是常用的。此外,在生物學(xué)家和臨床醫(yī)生中正產(chǎn)生以下意識(shí) 對(duì)于大多數(shù)疾病和所關(guān)心的狀況而言,將發(fā)現(xiàn)單個(gè)變量(單變量)標(biāo)識(shí)是不太可能的;多個(gè)變量(多變量)標(biāo)識(shí)被認(rèn)為是必需的,這增加了標(biāo)識(shí)發(fā)現(xiàn)的組合的挑戰(zhàn)。困擾該領(lǐng)域的一個(gè)困難是數(shù)據(jù)集總是表征為測(cè)量有余但案例不足(case poor),即存在明顯多于患者的測(cè)量。 因此,模式發(fā)現(xiàn)方法變得易于發(fā)現(xiàn)寄生模式,即基于給定的數(shù)據(jù)預(yù)測(cè)良好但基于新案例則預(yù)測(cè)不佳的模式。這也被稱為過擬合。用于通過丟棄某些被認(rèn)為低質(zhì)量的或不太可能與臨床問題有關(guān)的測(cè)量來減少測(cè)量數(shù)量的各種方案,比如用于重采樣和交叉驗(yàn)證的方案,已被應(yīng)用以克服過擬合,但該問題不能完全通過這些方法來克服。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種克服這樣的過擬合問題的改進(jìn)的方法。根據(jù)一個(gè)方面,本發(fā)明涉及一種確定根據(jù)從樣本群收集的臨床數(shù)據(jù)確定的至少一組標(biāo)識(shí)的可靠性的方法,這些標(biāo)識(shí)是通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性獲得的,其中每個(gè)標(biāo)識(shí)生成對(duì)樣本群分層的第一組分層值,該方法包括
提供至少一個(gè)附加和平行分層源到從所述樣本群獲得的標(biāo)識(shí),所述至少一個(gè)平行分層源獨(dú)立于這些標(biāo)識(shí)并且生成用于樣本群的第二組分層值, 對(duì)于各個(gè)相應(yīng)樣本而言,比較 第一組分層值與真實(shí)參考分層值, 第二組分層值與真實(shí)參考分層值,
利用相似性度量指標(biāo)對(duì)這些標(biāo)識(shí)賦值,該相似性度量指標(biāo)指示第一和第二分層值是否與真實(shí)參考分層值匹配,并且將該相似性度量指標(biāo)實(shí)現(xiàn)為在確定這些標(biāo)識(shí)的可靠性時(shí)的輸入。因此,現(xiàn)在有可能針對(duì)這些標(biāo)識(shí)的“對(duì)準(zhǔn)”將這些標(biāo)識(shí)與特定的平行分層標(biāo)準(zhǔn)比較并且因此幫助消除寄生模式。在一個(gè)實(shí)施例中,將相似性度量指標(biāo)實(shí)現(xiàn)為輸入的步驟包括
識(shí)別哪些標(biāo)識(shí)具有指示它們的分層值與真實(shí)參考分層值不匹配的相似性度量指標(biāo),并且對(duì)于那些被識(shí)別的標(biāo)識(shí)
確定指示這些標(biāo)識(shí)的分層值與至少一個(gè)平行分層源的分層值如何對(duì)準(zhǔn)的對(duì)準(zhǔn)指標(biāo),該對(duì)準(zhǔn)指標(biāo)指示這些標(biāo)識(shí)的可靠性。為了說明的目的,參照詳細(xì)描述中的表I和II,這意味著對(duì)于一種標(biāo)識(shí),確定與真實(shí)參考分層值相比,該標(biāo)識(shí)對(duì)于哪些樣本進(jìn)行了錯(cuò)誤分類(在此情況下,假陰性(FN)或假陽(yáng)性(FP))。第二步驟是,將這些錯(cuò)誤分類與平行分層源比較,即執(zhí)行另一個(gè)“可靠性步驟”。 該比較表明它們中的兩個(gè)與平行分層源匹配。應(yīng)當(dāng)注意,表1和2主要目的用于列出(錯(cuò)誤) 分類的所有可能的組合而不描繪具有例如100或200個(gè)樣本的現(xiàn)實(shí)實(shí)例。在一個(gè)實(shí)施例中,確定對(duì)準(zhǔn)指標(biāo)的步驟包括確定標(biāo)識(shí)的分層值與由至少一個(gè)平行分層源生成的分層值匹配的頻率,該數(shù)字指示標(biāo)識(shí)的可靠性。參照表III,所述實(shí)施例在標(biāo)識(shí)1、2和3三個(gè)標(biāo)識(shí)之間進(jìn)行選擇是有利的。應(yīng)當(dāng)再次注意,這僅僅是為了說明的目的并且不反映真實(shí)的情形,在真實(shí)情形中樣本的數(shù)量典型地將大得多。在該情形中,所有標(biāo)識(shí)表現(xiàn)出僅50%的正確分類(與真實(shí)值相比)。在缺少該附加的一個(gè)或多個(gè)平行分層源時(shí),將不可能區(qū)分這三個(gè)標(biāo)識(shí)。然而,通過更詳細(xì)地觀看標(biāo)識(shí) 1的表,兩個(gè)錯(cuò)誤分類與平行分層源匹配(樣本2和4);對(duì)于標(biāo)識(shí)2,也有兩個(gè)錯(cuò)誤分類與平行分層源匹配(樣本4和5);但是對(duì)于標(biāo)識(shí)3,三個(gè)錯(cuò)誤分類與平行分層源匹配(樣本2、5和 7)。在該特定情況下,對(duì)準(zhǔn)指標(biāo)簡(jiǎn)單地為“計(jì)數(shù)”(或百分比),即與平行標(biāo)準(zhǔn)匹配的數(shù)量,即 “2”、“2”和“3”。因而,標(biāo)識(shí)3將被認(rèn)為是比其余標(biāo)識(shí)更可靠的標(biāo)識(shí),因?yàn)樗膫€(gè)錯(cuò)誤分類中的3個(gè)與平行分層源匹配。為了進(jìn)一步說明,假設(shè)存在例如從正設(shè)法將癌癥患者分層為侵略性的和非侵略性的基因表達(dá)獲得的兩個(gè)標(biāo)識(shí)Sl和S2。通過僅使用所述標(biāo)識(shí)(基本模態(tài),基因表達(dá)),只可能說兩個(gè)標(biāo)識(shí)產(chǎn)生例如4個(gè)錯(cuò)誤分類并且因此在哪個(gè)標(biāo)識(shí)更可能是臨床相關(guān)的或生物學(xué)相關(guān)的這方面不可能有把握前進(jìn)。平行分層源(例如臨床預(yù)后指數(shù))也給出了相同患者到侵略性和非侵略性的獨(dú)立分層。平行分層使得有可能觀察到與Sl相比,S2產(chǎn)生與臨床預(yù)后指數(shù)相比較的更多的錯(cuò)誤分類?;诖丝梢詳喽⊿1是比S2 “更好的”標(biāo)識(shí),因?yàn)镾l與平行分層更“一致”。因此,與S2相比,Sl將具有更高的可靠性指數(shù)。在一個(gè)實(shí)施例中,平行分層基于一種或多種下述測(cè)量 臨床信息,或
成像數(shù)據(jù),或
從高吞吐量分子測(cè)量獲得的數(shù)據(jù),或分子測(cè)量的生物學(xué)注解。在一個(gè)實(shí)施例中,該方法進(jìn)一步包括連續(xù)地重復(fù)所述比較步驟、所述賦值步驟和所述實(shí)現(xiàn)步驟直到滿足預(yù)定義的標(biāo)準(zhǔn)為止。在一個(gè)實(shí)施例中,重復(fù)所述比較步驟直到滿足了預(yù)定義的標(biāo)準(zhǔn)為止是基于實(shí)現(xiàn)可靠性指標(biāo)以在一個(gè)步驟中對(duì)標(biāo)識(shí)排名并且作為用于選擇哪些標(biāo)識(shí)應(yīng)當(dāng)在后續(xù)步驟中被考慮的選擇標(biāo)準(zhǔn)。因此,通過使用可靠性指標(biāo)的這種迭代應(yīng)用,依賴于平行標(biāo)準(zhǔn)的分層能力,過擬合的效應(yīng)被消除或至少被減少。在一個(gè)實(shí)施例中,預(yù)定義的標(biāo)準(zhǔn)包括基于下列一個(gè)或多個(gè)的一個(gè)或多個(gè)結(jié)束迭代的標(biāo)準(zhǔn)
“固定數(shù)量的迭代 “期望的對(duì)準(zhǔn)性能 “期望的可靠性性能。應(yīng)注意,這不是窮舉性列表。根據(jù)另一個(gè)方面,本發(fā)明涉及一種計(jì)算機(jī)程序產(chǎn)品,其用于在該產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)命令處理單元執(zhí)行上述方法步驟。根據(jù)又一個(gè)方面,本發(fā)明涉及一種用于確定至少一組標(biāo)識(shí)的可靠性指標(biāo)的設(shè)備, 該至少一組標(biāo)識(shí)根據(jù)從樣本群收集的臨床數(shù)據(jù)而獲得,這些標(biāo)識(shí)是通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性而獲得的,其中每個(gè)標(biāo)識(shí)生成對(duì)樣本群分層的第一組分層值,該設(shè)備包括
用于提供至少一個(gè)附加且平行分層源到從所述樣本群獲得的標(biāo)識(shí)的裝置,所述至少一個(gè)平行分層源獨(dú)立于這些標(biāo)識(shí)并且生成用于樣本群的第二組分層值, 用于對(duì)于各個(gè)相應(yīng)樣本進(jìn)行以下比較的處理器 第一組分層值與真實(shí)參考分層值, 第二組分層值與真實(shí)參考分層值,
用于利用相似性度量指標(biāo)對(duì)這些標(biāo)識(shí)賦值的處理器,該相似性度量指標(biāo)指示第一和第二分層值是否與參考分層值匹配,以及
用于將該相似性度量指標(biāo)實(shí)現(xiàn)為確定這些標(biāo)識(shí)的可靠性時(shí)的輸入的處理器。本發(fā)明的各方面中的每一個(gè)可以與任意一個(gè)其它方面組合。本發(fā)明的這些和其它方面將根據(jù)下文描述的實(shí)施例而清楚并且參照這些實(shí)施例而被闡明。
本發(fā)明的這些實(shí)施例將參照附圖僅通過實(shí)例的方式予以描述,在附圖中圖1示出根據(jù)本發(fā)明的方法的流程圖,
圖2描繪了將平行標(biāo)準(zhǔn)到添加到標(biāo)識(shí)發(fā)現(xiàn)過程,以及圖3示出根據(jù)本發(fā)明的設(shè)備。
具體實(shí)施例方式圖1示出根據(jù)本發(fā)明的確定至少一組標(biāo)識(shí)的可靠性指標(biāo)的方法的流程圖,該至少一組標(biāo)識(shí)根據(jù)從樣本群收集的臨床數(shù)據(jù)而獲得。在步驟(Si) 101中,通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性生成這些標(biāo)識(shí)。作為實(shí)例,樣本群可以包括從潛在的癌癥患者收集的樣本并且臨床數(shù)據(jù)可以是在這些樣本上執(zhí)行的高吞吐量分子測(cè)量。對(duì)這樣的數(shù)據(jù)的分析結(jié)果將給出一組標(biāo)識(shí),即,為此特定類型的癌癥的特性的標(biāo)識(shí)。由于術(shù)語標(biāo)識(shí)(或者也稱為分子標(biāo)識(shí))是指臨床數(shù)據(jù)中表示遍及所有樣本的共同特征的任何特性??梢詰?yīng)用各種方法獲得這樣的標(biāo)識(shí),例如通過使用諸如遺傳算法(GA)之類的搜索方法,其產(chǎn)生特征子集,該特征子集用于導(dǎo)出為一組樣本提供測(cè)試分類的標(biāo)識(shí)。關(guān)于這種基于GA的試驗(yàn)的進(jìn)一步的細(xì)節(jié)可以在“Schaffer,A. Janevski, and Μ. Simpson, 〃A Genetic Algorithm Approach for Discovering Diagnostic Patterns in Molecular Measurement Data, “ presented at Proceedings of the 2005 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology, CIBCB 2005, La Jolla, CA, USA, 2005”中找到,該文獻(xiàn)全文通過引用于此并入。這些標(biāo)識(shí)生成第一分層值,其針對(duì)所述標(biāo)識(shí)對(duì)樣本群分層。這意味著,每個(gè)樣本僅有一個(gè)分層賦值,其中每個(gè)樣本可以被賦值為“侵略性的”或“非侵略性的”,或標(biāo)記為“O”或 “1”,或者在甚至特定的數(shù)值范圍上,例如從1到3。因此,在存在100個(gè)樣本標(biāo)識(shí)的情況下, 特定標(biāo)識(shí)為這100個(gè)樣本中的每一個(gè)提供比如0或1的分層值。如前所討論,本發(fā)明處理以下情形由于與相對(duì)較大數(shù)量的測(cè)量相比有非常少的樣本的原因,數(shù)據(jù)本身不足以保證“良好”標(biāo)識(shí)。這種數(shù)據(jù)的分析易于發(fā)現(xiàn)偶然地看起來非常好地表征該數(shù)據(jù)的寄生模式。如稍后將更詳細(xì)地討論的,通過另外地表征模式,可能從 “真實(shí)”(更有希望的)模式中認(rèn)出寄生模式。在步驟(S2) 103中,從所述樣本群提供至少一個(gè)平行分層源,其中所述至少一個(gè)平行分層源獨(dú)立于這些標(biāo)識(shí)并且生成用于樣本群的第二組分層值。這意味著,提供了用于表征的附加源,但是其中該附加源是使用不同方法獲得的。因此,對(duì)于各個(gè)相應(yīng)樣本,除了這些標(biāo)識(shí)之外,還提供了平行分層源,并且該平行分層源生成第二分層值,例如“侵略性的” 或“非侵略性的”,或者“0”或“1”。這意味著,利用分層值為樣本1賦值,即,例如將樣本1分層為“非侵略性的”,并且作為附加源,該平行分層源將樣本也分層為“非侵略性的”。因此, 一個(gè)源是從臨床數(shù)據(jù)獲得的標(biāo)識(shí),并且平行分層源可以例如是從臨床信息獲得的,所述臨床信息例如為預(yù)后指數(shù),比如對(duì)于乳腺癌而言的下列指數(shù)=Nottingham Prognosis Index (Pinder, Elston等人· 2003) ^National Institutes of Health Consensus (NIH 2001) 禾口 the St. Gallen Consensus Conference (Ciatto, Cecchini 等人· 1990)。添力口這禾中平行分層的原因是,使得能夠針對(duì)這些標(biāo)識(shí)與特定的平行分層標(biāo)準(zhǔn)的“對(duì)準(zhǔn)”來比較這些標(biāo)識(shí)。這將在稍后更詳細(xì)地被討論。一般地,本發(fā)明的目的是通過使用完全不同的方法設(shè)法得到相同種類的分層(例如侵略性的對(duì)比非侵略性的)。這樣的平行分層源的其它實(shí)例是從成像數(shù)據(jù)獲得的源,該成像數(shù)據(jù)是來自任何相關(guān)的成像模態(tài)(MRI、CT,具有或不具有造影劑)的數(shù)據(jù),這種數(shù)據(jù)可以通過以下方式分析該方式以與對(duì)“核心”的分析相似的方式對(duì)樣本分層,例如高吞吐量分子測(cè)量。這典型地通過分析圖像特征(形狀、紋理等)并輸出每個(gè)圖像/樣本的類別(例如侵略性的或非侵略性的) 來完成。其它平行分層源是高吞吐量分子測(cè)量基因表達(dá)數(shù)據(jù)、DNA甲基化作用、質(zhì)譜蛋白質(zhì)組學(xué)。只要來自這樣的測(cè)量的數(shù)據(jù)按照與“核心”高吞吐量測(cè)量相似地表征樣本的方式被分析,則可能使用所述輸出來驅(qū)動(dòng)基本的標(biāo)識(shí)發(fā)現(xiàn)過程。另一些的平行分層源是注解高吞吐量分子測(cè)量中的特征可以例如基于它們的生物屬性而被表征。廣泛使用的用于注解的源例如是基因本體論(參見geneontology. org),其中基因針對(duì)它們的分子功能、生物過程和細(xì)胞成分來進(jìn)行注解。這種注解也可以用于表征關(guān)于所述分子功能的一組特征(例如基因)。隨后所述數(shù)據(jù)的該視圖可以以與上述對(duì)樣本分層的其它類型方式相同的方式來使用。在步驟(S3) 105中,針對(duì)各個(gè)相應(yīng)樣本,執(zhí)行比較步驟,其中將第一分層值和第二分層值與真實(shí)參考分層值比較。真實(shí)參考分層值被認(rèn)為是“地面實(shí)況”,因?yàn)樵摂?shù)據(jù)來自回顧性研究,例如在癌癥患者中,將有5年或10年的跟蹤并且因此將會(huì)知道該癌癥是否恢復(fù)。 因此,在該步驟中,針對(duì)樣本n,將樣本η的第一分層值和平行分層源的第二分層值(例如基于圖像數(shù)據(jù))與地面實(shí)況值相比較。在步驟(S4) 107中,這些標(biāo)識(shí)利用相似性度量指標(biāo)來賦值,該相似性度量指標(biāo)指示第一和第二分層值是否與真實(shí)參考分層值匹配。作為實(shí)例,如果樣本η的參考分層值(地面實(shí)況值)為“侵略性的”并且第一分層值和第二分層值分別為“侵略性的”和“非侵略性的”,則相似性度量指標(biāo)可以是“真”和“假”,或者“真陽(yáng)性”和“假陽(yáng)性”。這也可以被標(biāo)記為“ + ”和“-”。針對(duì)所有η個(gè)樣本,重復(fù)該操作,即,針對(duì)各個(gè)相應(yīng)樣本,將第一分層值和第二分層值與真實(shí)參考值比較。表 I
權(quán)利要求
1.一種確定至少一組標(biāo)識(shí)的可靠性指標(biāo)(Si,101)的方法,該至少一組標(biāo)識(shí)根據(jù)從樣本群收集的臨床數(shù)據(jù)而確定,所述標(biāo)識(shí)是通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性獲得的,其中每個(gè)標(biāo)識(shí)生成對(duì)樣本群分層的第一組分層值,該方法包括提供至少一個(gè)附加和平行分層源到從所述樣本群獲得的標(biāo)識(shí)(S2,103),所述至少一個(gè)平行分層源獨(dú)立于所述標(biāo)識(shí)并且生成用于樣本群的第二組分層值, 對(duì)于各個(gè)相應(yīng)樣本而言,比較(S3,105) 第一組分層值與真實(shí)參考分層值, 第二分層值與真實(shí)參考分層值,利用相似性度量指標(biāo)對(duì)所述標(biāo)識(shí)賦值(S4,107),該相似性度量指標(biāo)指示第一和第二分層值是否與真實(shí)參考分層值匹配,并且將該相似性度量指標(biāo)實(shí)現(xiàn)為在確定所述標(biāo)識(shí)的可靠性時(shí)的輸入(S5,109)。
2.根據(jù)權(quán)利要求1的方法,其中將相似性度量指標(biāo)實(shí)現(xiàn)為輸入的步驟包括識(shí)別哪些標(biāo)識(shí)具有指示它們的分層值與真實(shí)參考分層值不匹配的相似性度量指標(biāo),并且對(duì)于那些被識(shí)別的標(biāo)識(shí)確定指示所述標(biāo)識(shí)的分層值與至少一個(gè)平行分層源的分層值如何對(duì)準(zhǔn)的對(duì)準(zhǔn)指標(biāo),該對(duì)準(zhǔn)指標(biāo)指示所述標(biāo)識(shí)的可靠性。
3.根據(jù)權(quán)利要求2的方法,其中確定對(duì)準(zhǔn)指標(biāo)的步驟包括確定標(biāo)識(shí)的分層值與由至少一個(gè)平行分層源生成的分層值匹配的頻率,該數(shù)字指示所述標(biāo)識(shí)的可靠性。
4.根據(jù)權(quán)利要求1的方法,其中平行分層基于一種或多種下述測(cè)量 臨床信息,或成像數(shù)據(jù),或從高吞吐量分子測(cè)量獲得的數(shù)據(jù),或所述分子測(cè)量的生物學(xué)注解。
5.根據(jù)權(quán)利要求1或2的方法,進(jìn)一步包括連續(xù)地重復(fù)(111)生成標(biāo)識(shí)組的步驟并且重復(fù)步驟(S3,105-S5, 109)直到滿足預(yù)定義的標(biāo)準(zhǔn)為止。
6.根據(jù)權(quán)利要求5的方法,其中重復(fù)步驟直到滿足預(yù)定義的標(biāo)準(zhǔn)為止是基于實(shí)現(xiàn)可靠性指標(biāo)以在一個(gè)步驟中對(duì)標(biāo)識(shí)排名并且作為用于選擇哪些標(biāo)識(shí)應(yīng)當(dāng)在后續(xù)步驟中被考慮的選擇標(biāo)準(zhǔn)。
7.根據(jù)權(quán)利要求2或5的方法,其中所述預(yù)定義的標(biāo)準(zhǔn)包括基于下列一個(gè)或多個(gè)的一個(gè)或多個(gè)結(jié)束迭代的標(biāo)準(zhǔn)-固定數(shù)量的迭代 -期望的對(duì)準(zhǔn)性能 -期望的可靠性性能。
8.一種計(jì)算機(jī)程序產(chǎn)品,其用于在該產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)命令處理單元執(zhí)行權(quán)利要求1的方法步驟。
9.一種用于確定至少一組標(biāo)識(shí)的可靠性指標(biāo)的設(shè)備,其中該至少一組標(biāo)識(shí)根據(jù)從樣本群收集的臨床數(shù)據(jù)而獲得,所述標(biāo)識(shí)是通過檢測(cè)來自樣本群的臨床數(shù)據(jù)中的特性而獲得的,其中每個(gè)標(biāo)識(shí)生成對(duì)樣本群分層的第一組分層值,該設(shè)備包括用于提供至少一個(gè)附加且平行分層源到從所述樣本群獲得的標(biāo)識(shí)的裝置(301),所述至少一個(gè)平行分層源獨(dú)立于所述標(biāo)識(shí)并且生成用于樣本群的第二組分層值, 用于針對(duì)各個(gè)相應(yīng)樣本進(jìn)行以下比較的處理器(302) 第一組分層值與真實(shí)參考分層值, 第二組分層值與真實(shí)參考分層值,用于利用相似性度量指標(biāo)對(duì)所述標(biāo)識(shí)賦值的處理器,該相似性度量指標(biāo)指示第一和第二分層值是否與參考分層值匹配,以及用于將該相似性度量指標(biāo)實(shí)現(xiàn)為確定所述標(biāo)識(shí)的可靠性時(shí)的輸入的處理器。
全文摘要
本發(fā)明涉及用于確定至少一組標(biāo)識(shí)的可靠性指標(biāo)的方法和設(shè)備,該至少一組標(biāo)識(shí)根據(jù)從樣本群中收集的臨床數(shù)據(jù)而獲得。這些標(biāo)識(shí)是通過檢測(cè)來自所述樣本群的臨床數(shù)據(jù)中的特性獲得的,并且每一個(gè)標(biāo)識(shí)生成對(duì)所述樣本群分層的第一組分層值。提供至少一個(gè)附加且平行分層源到從樣本群獲得的這些標(biāo)識(shí),到所述標(biāo)識(shí)的所述至少一個(gè)附加且平行分層源獨(dú)立于這些標(biāo)識(shí)并且生成第二組分層值。針對(duì)各個(gè)相應(yīng)樣本進(jìn)行比較,其中將第一分層值與真實(shí)參考分層值相比較,并且其中將第二分層值與真實(shí)參考分層值相比較。利用相似性度量指標(biāo)來對(duì)這些標(biāo)識(shí)賦值,該相似性度量指標(biāo)指示第一和第二分層值是否與真實(shí)參考分層值相匹配。隨后,這些相似性度量指標(biāo)被實(shí)現(xiàn)為在確定所述標(biāo)識(shí)的可靠性時(shí)的輸入。
文檔編號(hào)G06F19/00GK102171699SQ200980139288
公開日2011年8月31日 申請(qǐng)日期2009年9月24日 優(yōu)先權(quán)日2008年10月2日
發(fā)明者A·賈尼夫斯基, N·巴納杰, V·瓦拉丹, Y·H·阿爾薩法迪 申請(qǐng)人:皇家飛利浦電子股份有限公司