專利名稱:評估癌癥狀態(tài)的方法、癌癥評估裝置、癌癥評估方法、癌癥評估系統(tǒng)、癌癥評估程序和記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
0001本發(fā)明涉及評估評估癌癥狀態(tài)的方法、癌癥評估裝置、 癌癥評估方法、癌癥評估系統(tǒng)、癌癥評估程序和記錄介質(zhì),其利用血 液(血漿)中氨基酸的濃度。
背景技術(shù):
00022004年日本死于癌癥的人數(shù)是男性193075人,女性 127259人,并且該死亡人數(shù)在全部死亡總?cè)藬?shù)中排第一位。存活率可 能依賴于癌癥的類型,但存在某些類型,其早期癌癥的五年存活率是 80%或更高,但其晚期癌癥(progressive cancer )的五年存活率非常低 例如大約10%。因此,早期檢測對于治療癌癥而言是重要的。
0003此處,結(jié)直腸癌的診斷包括例如基于免疫學排泄物顯微 鏡觀察血液反應(yīng)的診斷、通過結(jié)腸鏡檢查的結(jié)直腸活組織檢查。
然而,基于排泄物顯微鏡觀察血液測試的診斷不能作為確定的診 斷,并且大部分具有陽性結(jié)果的人是假陽性。而且,關(guān)于早期結(jié)直腸 癌,存在關(guān)于檢測靈敏度和檢測特異性二者在基于排泄物顯微鏡觀察 血液測試的診斷中都變低的考慮。特別的,在通過排泄物顯微鏡觀察 血液測試進行診斷時,通常會忽視右側(cè)結(jié)腸中的早期癌癥。通過CT(計 算機斷層掃描)、MRI(磁共振成像)、PET (正電子發(fā)射計算機斷層掃 描)等的成像不適于診斷結(jié)直腸癌。
另一方面,通過結(jié)腸鏡檢查的結(jié)直腸活組織檢查作為確定的診斷, 但是高度侵入性檢查,并且在篩選階段采用結(jié)直腸活組織檢查是不實 際的。而且,侵入性診斷例如結(jié)直腸活組織檢查為患者施加了壓力, 例如伴隨的疼痛,還有可能在檢查后出血的風險,等。
因此,從施加給患者的生理負擔和性價比的角度,期望縮小發(fā)生 結(jié)直腸癌可能性高的測試個體的靶范圍,并對這些人進行治療。具體 的,期望通過侵入性較低的方法選擇測試個體,并通過對所選擇的測 試個體進行結(jié)腸鏡檢查而縮小所選擇測試個體的靶范圍,并對確定診
9斷為患有結(jié)直腸癌的測試個體進行治療。
0004作為另一個例子,肺癌的診斷包括通過使用X-射線圖片、 CT、 MRI、 PET等進行成像、痰液細胞學診斷、利用支氣管鏡的肺活 組織檢查、利用經(jīng)皮針的肺活組織檢查、通過解釋式(explanatory)胸 廓切開術(shù)或利用胸腔鏡的肺活組織檢查的診斷,等。
然而,通過成像的診斷不能作為確定的診斷。例如,在胸部X-射 線檢查(間接X光線照相術(shù))中,陽性結(jié)果率是20%,而特異性是0.1%, 大部分具有陽性結(jié)果的人都是假陽性。而且,在胸部X-射線檢查中, 檢測靈敏度低,根據(jù)日本厚生勞動省的某些檢查結(jié)果還報道大約80% 的已經(jīng)發(fā)生肺癌的患者被忽視。特別地,在早期肺癌中,存在通過成 像的診斷檢測靈敏度低的考慮。在胸部X-射線檢查中,還存在將測試 個體暴露到輻射的問題。從便利和成本的角度,通過CT、 MRI、 PET 等診斷性成像也不適于作為大量篩選進行。在痰液細胞學診斷中,只 能確定地診斷大約20~30%的患者。
另一方面,使用支氣管鏡、經(jīng)皮針、解釋式胸廓切開術(shù)或胸腔鏡 的肺活組織檢查作為確定的診斷,但是高度侵入性檢查,并且對所有 懷疑患有肺癌的患者執(zhí)行肺活組織檢查是不實際的。而且,這些侵入 性檢查對患者產(chǎn)生了壓力,例如伴隨的疼痛,并且還可以有在檢查后 出血的風險,等。
因此,從施加給患者的生理負擔和性價比的角度,期望縮小發(fā)生 肺癌可能性高的測試個體的靶范圍,并對這些人進行治療。具體的, 期望通過侵入性較低的方法選擇測試個體,并通過對所選擇的測試個 體進行肺活組織檢查而縮小所選擇測試個體的靶范圍,并對確定診斷 為患有肺癌的測試個體進行治療。
0005作為另一個例子,乳癌的診斷包括自身檢查、乳房觸診 和一見覺檢測、通過乳房X線照相術(shù)、CT、 MRI、 PET等進行診斷成^f象、 穿刺活檢等。
然而,自身檢查、乳房觸診和視覺檢測和診斷成像不能作為確定 的診斷。特別的,自身檢查不能有效地達到降低乳癌死亡率的程度。 而且,自身檢查不能如同通過乳房X線照相術(shù)所進行的常規(guī)篩選一樣 實現(xiàn)發(fā)現(xiàn)大量早期癌癥。在早期乳癌中,存在自身檢查、乳房觸診和 視覺檢測或診斷成像在檢測靈敏度和檢測特異性二者中更差的考慮。通過乳房X線照相術(shù)進行診斷成像還具有將測試個體暴露到輻射或過
度診斷(overdiagnosis )的問題。從便利和成本的角度,通過CT、 MRI、 PET等進行診斷成像還不適于作為大量篩選而進行。
另一方面,穿刺活檢作為確定的診斷,但是高度侵入性檢查,并 且對所有根據(jù)診斷成像懷疑患有乳癌的患者進行穿刺活檢是不實際 的。而且,諸如穿刺活檢的侵入性診斷對患者產(chǎn)生了壓力,例如伴隨 的疼痛,還可能有在檢查后出血的風險,等。
通常,認為,在除了自身檢查外的許多情況中,乳癌的檢查會使 得測試個體猶豫不決。
因此,從施加給生理壓力和心理壓力,以及性價比的角度,期望 縮小發(fā)生乳癌可能性高的測試個體的靶范圍,并對這些人進行治療。 具體的,期望通過伴隨較少心理痛苦或侵入性較低的方法對測試個體 進行選擇,并對確定診斷為患有乳癌的測試個體進行治療。
0006作為另一個例子,胃癌的診斷包括胃蛋白酶原測試、X-射線檢查(間接X光線照相術(shù))、胃窺鏡檢查、利用腫瘤標記物的診 斷,等。
然而,胃蛋白酶原測試、X-射線檢查和利用腫瘤標記物的診斷不 能作為確定的診斷。例如,胃蛋白酶原測試侵入性較低,但靈敏度在 不同的報道中變化,大約40%~85%,而特異性是70%~ 85%。然而, 在胃蛋白酶原測試中,整個檢查的選出率(rate of recall)是20%,認 為這些結(jié)果通常被忽視。在X-射線檢查中,靈敏度在不同的報道中變 化,大約70~80%,而特異性是85~90%。然而,X-射線檢查可能會 造成不利的不作用,因為引用了鋇,或者暴露到輻射。在利用腫瘤標 記物的診斷中,目前還不存在能有效診斷發(fā)生胃癌的肺瘤標記物。
另一方面,胃窺鏡檢查作為確定的診斷,但是高度侵入性檢查, 并且在篩選階段執(zhí)行胃窺鏡檢查是不實際的。而且,侵入性診斷例如 胃窺鏡檢查會對患者造成壓力,例如伴隨的疼痛,還可能有在檢查后 出血的風險,等。
因此,從對患者施加的生理壓力和性價比的角度,期望縮小發(fā)生 胃癌可能性高的測試個體的靶范圍,以及對這些人進行治療。具體的, 期望通過具有高靈敏度和特異性的方法對測試個體進行選擇,并通過 對測試個體進行胃窺鏡檢查而縮小所選擇的測試個體,并對確定診斷
ii為患有胃癌的測試個體進行治療。
0007而且,還存在難以早期檢測的癌癥,例如胰腺癌。 在胰腺癌中,在患者表達主觀癥狀的時候,通過徹底檢查患者被 確定地診斷為胰腺癌,但在許多情況中,該癌癥祐_診斷為晚期癌癥。
因此,從對患者施加的生理壓力和性價比的角度,期望通過適當 的篩選縮小發(fā)生胰腺癌可能性高的測試個體的靶范圍,并對這些人進 行治療。具體的,期望通過具有高靈敏度和特異性的方法對測試個體 進行選擇,并通過對所選擇的測試個體進行全面檢查而縮小所選擇測 試個體的靶范圍,并對確定診斷為患有胰腺癌的觀,H式個體進行治療。
0008順便提一下,已知血液中氨基酸的濃度會因為癌癥的發(fā) 生而變化。例如,Cynober (非專利文獻1)已經(jīng)報道癌癥細胞中消耗 量的提高,其中分別地,谷氨酰胺主要作為氧化能量來源,精氨酸作 為氮氧化物和多胺的前體,甲硫氨酸通過激活癌細胞的能力以攝入曱 硫氨酸。Vissers等人(非專利文獻2)和Park (非專利文獻3)已經(jīng)報 道在結(jié)直腸癌患者中血漿中氨基酸消耗與健康個體的不同。Proenza等 人(非專利文獻4)和Cascino (非專利文獻5)已經(jīng)報道乳癌患者中 血漿中的氨基酸消耗與健康個體的不同。
〖0009] Nonpatent Literature 1: Cynober, L. ed., Metabolic and therapeutic aspects of amino acids in clinical nutritior.. 2nd ed., CRC Press. Nonpatent Literature 2: Vissers, Y. LJ., et.al., Plasma arginine concentration are reduced in cancer patients: evidence for argir.ine deficiency , The American Journal of Clinical Nutritior., 2005 81, p. 1142-1146 Nonpatent Literature 3: Park, K.G., et Arginine metabolism in benign and maglinant disease of breast and colon: evidence for possible inhibition of tumor-infiltrating macrc'pharges., Nutrition, 1991 7, p.185-188 Nonpatent Literature 4: Proenza, A.M., J. Oliver, A. Palou and P, Roca, Breast and lung cancer are associated with adecrease in blood cell amino acid content. J Nutr Biochem, 2003. 14 (3): p. 133_8.
Nonpatent Literature 5: Cascino, A., M. Muscaritoli, C. Cangiano, L. Conversano, A. Laviano, S. Arie纖a, M.M. Meguid and F. Rossi Fanelli, Plasma amino acid imbalance in patients with lung and breast cancer. Anticancer Res, 1995, 15(2): p. 507-10.
發(fā)明內(nèi)容
本發(fā)明所要解決的問題
0010然而,存在問題,即從時間和成本的角度,并沒有進行 開發(fā)利用多種氨基酸作為解釋變量而診斷癌癥發(fā)生的存在或不存在的 技術(shù),并且沒有被實際使用。
0011本發(fā)明是根據(jù)上述的問題而進行的,并且本發(fā)明的目的 是提供評估癌癥狀態(tài)的方法、癌癥評估裝置、癌癥評估方法、癌癥評 估系統(tǒng)、癌癥評估程序和記錄介質(zhì),其能夠通過利用血液中的氨基酸 中與癌癥狀態(tài)相關(guān)的氨基酸的濃度而精確評估癌癥狀態(tài)。
解決問題的手段。
0012本發(fā)明的發(fā)明人已經(jīng)進行了深入的研究以解決上述問題, 結(jié)果,他們已經(jīng)鑒定了可以用于2組癌癥和非癌癥之間的鑒別的氨基 酸(具體的,在2組之間,以統(tǒng)計學上顯著的區(qū)別而變化的氨基酸), 并且已經(jīng)發(fā)現(xiàn)了包括所鑒定氨基酸的濃度作為解釋變量的多變量判別 式(關(guān)聯(lián)方程式,指數(shù)),其與癌癥(具體的,早期癌癥)的狀態(tài)(具 體的,病態(tài)的進展)顯著相關(guān)聯(lián),這樣完成了本發(fā)明。
0013為了解決所述問題,并達到上面所述的目的,根據(jù)本發(fā) 明的 一個方面的評估癌癥狀態(tài)的方法包括測量步驟,其測量關(guān)于從待 評估的個體收集的血液中氨基酸的濃度值的氨基酸濃度數(shù)據(jù);以及濃 度值標準評估步驟,其基于在測量步驟所測量的個體的氨基酸濃度數(shù) 據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA ( ABA 是a-氨基丁酸)中的至少一個的濃度值,對個體中的癌癥狀態(tài)進行評 估。
10014本發(fā)明的另一個方面是評估癌癥狀態(tài)的方法,其中濃度 值標準評估步驟還包括濃度值標準鑒別步驟,其鑒別癌癥患者和無癌 癥個體,這基于在測量步驟中所測量的個體的氨基酸濃度數(shù)據(jù)中所包 含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個
的濃度值。
0015本發(fā)明的另一個方面是評估癌癥狀態(tài)的方法,其中濃度 標準評估步驟還包括判別式值計算步驟,其計算判別式值,其中判別 式值是多變量判別式的數(shù)值,其基于在測量步驟所測量的個體的氨基 酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和 ABA中的至少 一個的濃度值以及之前利用氨基酸的濃度作為解釋變量 而建立的多變量判別式二者的濃度;以及判別式值標準評估步驟,其 評估個體中的癌癥狀態(tài),這基于在判別式值計算步驟中所計算的判別
式值,其中多變量判別式包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0016本發(fā)明的另一個方面是評估癌癥狀態(tài)的方法,其中判別 式值標準評估步驟還包括判別式值標準鑒別步驟,其鑒別癌癥患者和 無癌癥個體,這基于在判別式值計算步驟所計算的判別式值。
0017本發(fā)明的另一個方面是評估癌癥狀態(tài)的方法,其中多變 量判別式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多 變量判別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Ora、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0018本發(fā)明的另一個方面是評估癌癥的方法,其中多變量判 別式是式1或式2:<formula>formula see original document page 14</formula>
其中式1中的a!和h是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0019本發(fā)明的另一個方面試評估癌癥狀態(tài)的方法,其中多變 量判別式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量才幾(Support Vector Machine)所生成的判別式、通過Mahalanobis廣 義距離方法所生成的判別式、通過典型判別式分析所生成的判別式和 通過決策樹所生成的判別式的任意一種。
0020本發(fā)明的另一個方面是評估癌癥狀態(tài)的方法,其中多變 量判別式是利用Orn、Cys、Tau、Trp、Gln、和Cit作為解釋變量的Logistic 回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線 性判別式,利用Glu、Gly、ABA、Val、His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。
0021本發(fā)明還涉及癌癥評估裝置,根據(jù)本發(fā)明一個方面的癌 癥評估裝置包括控制單元和存儲器單元用于評估待評估個體中的癌癥 狀態(tài)??刂茊卧ㄅ袆e式值計算單元,其計算作為多變量判別式的 值的判別式值,這基于在先前獲得的關(guān)于個體中氨基酸濃度值的氨基 酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和 ABA中的至少一個的濃度值,以及在存儲器單元中所存儲的利用氨基 酸濃度作為解釋變量的多變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量;判別 式值標準評估單元,其評估個體中的癌癥狀態(tài),這基于判別式值計算 單元所計算的判別式值。
0022本發(fā)明的另一個方面是癌癥評估裝置,其中判別式值標 準評估單元還包括判別式值標準鑒別單元,其鑒別癌癥患者和無癌癥 個體,這根據(jù)判別式值計算單元所計算的判別式值。
0023本發(fā)明的另一個方面是癌癥評估裝置,其中多變量判別 式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判 別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0024本發(fā)明的另一個方面是癌癥評估裝置,其中多變量判別 式是式1或式2:
a"0rn/(Trp+Arg)+bix (Cys+Ile)/Leu+ci (式1 )
a2xGlu/His+b2xSer/rrp+C2><Val/:Lys+d2xPro/Arg+e2 (式2 )
15其中式1中的a!和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2
中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0025本發(fā)明的另一個方面是癌癥評估裝置,其中多變量判別 式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量枳j (Support Vector Machine)所生成的判別式、通過Mahalanobis廣義距離 方法所生成的判別式、通過典型判別式分析所生成的判別式和通過決 策樹所生成的判別式的任意 一 種。
0026本發(fā)明的另一個方面是癌癥評估裝置,其中多變量判別 式是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic 回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線 性判別式,利用Glu、Gly、ABA、Val、His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。
0027本發(fā)明的另一個方面是癌癥評估裝置,其中,控制單元 還包括多變量判別式生成單元,其生成存儲在存儲器單元中的多變量 判別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息,其中癌癥狀態(tài)信 息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌癥狀態(tài)指數(shù)數(shù) 據(jù)。多變量判別式生成單元還包括候選多變量判別式生成單元,其從 癌癥狀態(tài)信息生成作為多變量判別式候選的候選多變量判別式,這基 于預(yù)定的生成判別式的方法;候選多變量判別式校驗單元,其校驗由 候選多變量判別式生成單元生成的候選多變量判別式,這基于預(yù)定的 校驗方法;以及解釋變量選擇單元,其從通過候選多變量判別式校驗 單元所獲得的校驗結(jié)果選擇候選多變量判別式的解釋變量,這基于預(yù) 定的解釋變量選擇方法,這樣選擇了用于生成候選多變量判別式中的
癌癥狀態(tài)信息中所含有的氨基酸濃度數(shù)據(jù)的組合。多變量判別式生成 單元生成了多變量判別式,其通過從多個候選多變量判別式選擇用作 多變量判別式的候選多變量判別式,這基于通過重復(fù)執(zhí)行候選多變量 判別式生成單元、候選多變量判別式校驗單元和解釋變量選擇單元而 積累的校驗結(jié)果。
0028本發(fā)明還涉及癌癥評估方法,本發(fā)明的一個方面是評估 待評估的個體中癌癥狀態(tài)的癌癥評估方法。利用包括控制單元和存儲 器單元的信息處理裝置實施該方法。該方法包括(i)判別式值計算步驟,其計算作為多變量判別式數(shù)值的判別式值,這基于在之前所獲得
的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù)據(jù)中Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值以及存儲在存儲器 單元中利用氨基酸濃度作為解釋變量的多變量判別式二者,其中含有 Cys、 Gln、 Trp、 Om、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為 解釋變量,以及(ii)判別式值標準評估步驟,其評估個體中的癌癥狀 態(tài),這基于在判別式值計算步驟中所計算的判別式值。步驟(i)和(ii) 都是通過控制單元執(zhí)行的。
0029本發(fā)明的另一個方面是癌癥評估方法,其中判別式值標 準評估步驟還包括判別式值標準鑒別步驟,其鑒別癌癥患者和無癌癥 個體,這基于在判別式值計算步驟中所計算的判別式值。
0030本發(fā)明的另一個方面是癌癥評估方法,其中多變量判別 式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判 別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0031本發(fā)明的另一個方面是癌癥評估方法,其中多變量判別 式是式1或式2:
a工xOrn/ (Trp+Arg〉化,(Cys+Ile) /:Leu+c丄 (式1 )
a2xGlu/His+b2xSer/Trp+C2xVal/:Lys+d2xP:i:o/A:rg+e2 (式2 )
其中式1中的a!和b^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0032本發(fā)明的另一個方面是癌癥評估方法,其中多變量判別 式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量機 (Support Vector Machine)所生成的判別式、通過Mahalanobis廣義3巨離 方法所生成的判別式、通過典型判別式分析所生成的判別式和通過決 策樹所生成的判別式的任意一種。
0033本發(fā)明的另一個方面是癌癥評估方法,其中多變量判別 式是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic 回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式,利用Glu、Gly、ABA、Val、His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。
0034本發(fā)明的另一個方面是癌癥評估方法,其中該方法還包 括控制單元執(zhí)行的多變量判別式生成步驟,其生成存儲在存儲器單元 中的多變量判別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息,其中 癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌癥狀 態(tài)指數(shù)數(shù)據(jù)。多變量判別式生成步驟還包括控制單元執(zhí)行的候選多變 量判別式生成步驟,其從癌癥狀態(tài)信息生成作為多變量判別式候選的 候選多變量判別式,這基于預(yù)定的生成判別式的方法;候選多變量判 別式校驗步驟,其校驗在候選多變量判別式生成步驟生成的候選多變 量判別式,這基于預(yù)定的校驗方法;以及解釋變量選擇單元,其從在 候選多變量判別式校驗步驟中所獲得的校驗結(jié)果選擇候選多變量判別 式的解釋變量,這基于預(yù)定的解釋變量選擇方法,這樣選擇了用于生 成候選多變量判別式中的癌癥狀態(tài)信息中所含有的氨基酸濃度數(shù)據(jù)的 組合。在多變量判別式生成步驟,生成了多變量判別式,其通過從多 個候選多變量判別式選擇用作多變量判別式的候選多變量判別式,這 基于通過重復(fù)執(zhí)行候選多變量判別式生成步驟、候選多變量判別式校 驗步驟和解釋變量選擇步驟而積累的校驗結(jié)果。
0035本發(fā)明還涉及癌癥評估系統(tǒng),根據(jù)本發(fā)明一個方面的癌 癥評估系統(tǒng)包括癌癥評估裝置,該裝置包括控制單元和存儲器單元以 評估待評估個體中的癌癥狀態(tài);以及信息通信終端裝置,其提供關(guān)于 通過網(wǎng)絡(luò)為相互通信連接的個體中氨基酸濃度值的氨基酸濃度數(shù)據(jù)。 信息通信終端裝置包括氨基酸濃度數(shù)據(jù)發(fā)送單元,其將個體的氨基酸 濃度數(shù)據(jù)傳輸?shù)桨┌Y評估裝置;以及評估結(jié)果接收單元,其接收從癌 癥評估裝置傳輸?shù)膫€體的癌癥狀態(tài)的評估結(jié)果。癌癥評估裝置的控制 單元包括氨基酸濃度數(shù)據(jù)接收單元,其接受從信息通信終端裝置傳輸 的個體的氨基酸濃度數(shù)據(jù);判別式值計算單元,其計算作為多變量判 別式的數(shù)值的判別式值,這基于氨基酸濃度數(shù)據(jù)接收單元所接受的個 體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值以及存儲在存儲器單元中的利用氨 基酸濃度作為解釋變量的多變量判別式二者,其中含有Cys、 Gln、 Trp、Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量;判別 式值標準評估單元,其評估個體中的癌癥狀態(tài),這基于判別式值計算 單元所計算的判別式值;以及評估結(jié)果發(fā)送單元,其將通過判別式值 標準評估單元所獲得的個體的評估結(jié)果傳輸?shù)叫畔⑼ㄐ沤K端裝置。
0036本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中判別式值標 準評估單元還包括判別式值標準鑒別單元,其鑒別癌癥患者和無癌癥
個體,這基于判別式值計算單元所計算的判別式值。
0037本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中多變量判別 式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判 別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0038本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中多變量判別 式是式1或式2:
a"Orn/ (Trp十Arg) (Cys+Ile) /Leu+ci (式1 )
a2xGlu/His+b2xSer/Trp+C2xVal/Lys+d2><Pro/Arg+e2 (式2 )
其中式1中的a!和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2
中的a2、 b2、 C2和cb是任意非零實數(shù),式2中的e2是任意實數(shù)。
0039本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中多變量判別 式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量機 (Support Vector Machine)所生成的判別式、通過Mahalanobis廣義距離 方法所生成的判別式、通過典型判別式分析所生成的判別式和通過決 策樹所生成的判別式的任意一種。
0040本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中多變量判別 式是利用Om、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic 回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線 性判別式,利用Glu、Gly、ABA、Val、His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。
0041本發(fā)明的另一個方面是癌癥評估系統(tǒng),其中癌癥評估裝
19置的控制單元還包括多變量判別式生成單元,其生成存儲在存儲器單 元中的多變量判別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息,其 中癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌癥 狀態(tài)指數(shù)數(shù)據(jù)。多變量判別式生成單元還包括候選多變量判別式生成 單元,其從癌癥狀態(tài)信息生成作為多變量判別式候選的候選多變量判 別式,這基于預(yù)定的生成判別式的方法;候選多變量判別式校驗單元, 其校驗由候選多變量判別式生成單元生成的候選多變量判別式,這基
于預(yù)定的校驗方法;以及解釋變量選擇單元,其從通過候選多變量判
別式校驗單元所獲得的校驗結(jié)果選擇候選多變量判別式的解釋變量, 這基于預(yù)定的解釋變量選擇方法,這樣選擇了用于生成候選多變量判 別式中的癌癥狀態(tài)信息中所含有的氨基酸濃度數(shù)據(jù)的組合。多變量判 別式生成單元生成了多變量判別式,其通過從多個候選多變量判別式 選擇用作多變量判別式的候選多變量判別式,這基于通過重復(fù)執(zhí)行候 選多變量判別式生成單元、候選多變量判別式校驗單元和解釋變量選 擇單元而積累的校驗結(jié)果。
0042本發(fā)明還涉及癌癥評估程序產(chǎn)品,本發(fā)明的一個方面是 癌癥評估程序產(chǎn)品,其使得包括控制單元和存儲器單元的信息處理裝 置執(zhí)行評估待評估的個體中癌癥狀態(tài)的方法。該方法包括(i)判別式 值計算步驟,其計算作為多變量判別式數(shù)值的判別式值,這基于在之 前所獲得的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù)據(jù)中Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值以及存 儲在存儲器單元中利用氨基酸濃度作為解釋變量的多變量判別式二 者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的 至少一個作為解釋變量,以及(ii)判別式值標準評估步驟,其評估個 體中的癌癥狀態(tài),這基于在判別式值計算步驟中所計算的判別式值。 步驟(i)和(ii)都是通過控制單元執(zhí)行的。
0043本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中判別式 值標準評估步驟還包括判別式值標準鑒別步驟,其鑒別癌癥患者和無 癌癥個體,這基于在判別式值計算步驟中所計算的判別式值。
0044本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中多變量 判別式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變 量判別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、
20Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
0045本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中多變量 判別式是式1或式2:
a,Qrn/ (Trp+Arg) +1: (Cys+Ile) /Leu+q (式1 )
a2xGlu/His+b2xSer7T:i:p+C2xVal/:Lys+d2xPro/A3:g+e2 (式2 )
其中式1中的a!和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的&2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0046本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中多變量 判別式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向 量才幾(Support Vector Machine)所生成的判別式、通過Mahalanobis廣義 距離方法所生成的判別式、通過典型判別式分析所生成的判別式和通 過決策樹所生成的判別式的任意一種。
0047本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中多變量 判別式是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic 回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線 性判別式,利用Glu、Gly、ABA、Val、His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。
0048本發(fā)明的另一個方面是癌癥評估程序產(chǎn)品,其中該方法 還包括控制單元執(zhí)行的多變量判別式生成步驟,其生成存儲在存儲器 單元中的多變量判別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息, 其中癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌 癥狀態(tài)指數(shù)數(shù)據(jù)。多變量判別式生成步驟還包括控制單元執(zhí)行的候選 多變量判別式生成步驟,其從癌癥狀態(tài)信息生成作為多變量判別式候 選的候選多變量判別式,這基于預(yù)定的生成判別式的方法;候選多變 量判別式校驗步驟,其校驗在候選多變量判別式生成步驟生成的候選 多變量判別式,這基于預(yù)定的校驗方法;以及解釋變量選擇單元,其 從在候選多變量判別式校驗步驟中所獲得的校驗結(jié)果選擇候選多變量 判別式的解釋變量,這基于預(yù)定的解釋變量選擇方法,這樣選擇了用
21于生成候選多變量判別式中的癌癥狀態(tài)信息中所含有的氨基酸濃度數(shù) 據(jù)的組合。在多變量判別式生成步驟,生成了多變量判別式,其通過 從多個候選多變量判別式選擇用作多變量判別式的候選多變量判別 式,這基于通過重復(fù)執(zhí)行候選多變量判別式生成步驟、候選多變量判 別式校驗步驟和解釋變量選擇步驟而積累的校驗結(jié)果。
0049本發(fā)明還設(shè)計記錄介質(zhì),根據(jù)本發(fā)明一個方面的記錄介
質(zhì)包括上面所述的癌癥評估程序。 發(fā)明效果
0050根據(jù)本發(fā)明評估癌癥狀態(tài)的方法,測量關(guān)于從待評估的 個體收集的血液中的氨基酸濃度值的氨基酸濃度數(shù)據(jù),以及評估個體 中的癌癥狀態(tài),這基于在所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的 Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃 度值。因此,血液中的氨基酸中涉及癌癥狀態(tài)的氨基酸濃度,可以用 于達到實現(xiàn)精確評估癌癥狀態(tài)的效果。
0051根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,鑒別癌癥患者和無 癌癥個體,這基于在所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值。 因此,在血液中氨基酸中可以用于鑒別2組癌癥和非癌癥氨基酸的濃 度,其可以用于達到實現(xiàn)精確鑒別2組癌癥和非癌癥的效果。
0052根據(jù)本發(fā)明評估癌癥狀態(tài)的方法,計算作為多變量判別 式的數(shù)值的判別式值,這基于在個體的所測量氨基酸濃度數(shù)據(jù)中所包 含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個 的濃度值以及之前建立的利用氨基酸濃度作為解釋變量的多變量判別 式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA 中的至少一個作為解釋變量評估個體中的癌癥狀態(tài),這基于所計算的 判別式值。因此,在與癌癥狀態(tài)顯著相關(guān)的多變量判別式中所獲得的 判別式值可以用于達到實現(xiàn)精確評估癌癥狀態(tài)的效果。
0053根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,鑒別癌癥患者和無 癌癥個體,這基于所計算的判別式值。因此,在可以用于鑒別2組癌 癥和非癌癥的多變量判別式中所獲得的判別式值可以用于達到實現(xiàn)精 確鑒別2組癌癥和非癌癥的效果。
20054根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,多變量判別式表達 為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的 分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。因此,在特別地 可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判別式值可 以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0055根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,多變量判別式是式1 或式2:
a^Orn/ (Trp+Arg) +bix (Cys+Ile) /Leu+Ci (式1 )
a2xGlu/His+b2xSer/'rrp+c2xVal/Lys+d2xPro/Arg+e2(式2 )
其中式1中的a!和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的az、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0056根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,多變量判別式是 Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量積j (Support Vector Machine)所生成的判別式、通過Mahalanobis廣義距離 方法所生成的判別式、通過典型判別式分析所生成的判別式和通過決 策樹所生成的判別式的任意一種。因此,在特別地可以用于鑒別2組 癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于達到實現(xiàn)更 精確鑒別2組癌癥和非癌癥的效果。
0057根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法,多變量判別式是利 用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic回歸方 程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別 式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。因此,在特別地可以用于鑒別2組癌癥和非癌癥的多 變量判別式中獲得的判別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥 和非癌癥的效果。0058根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,計算作為多變量判別式的數(shù)值的判別式值,這基于在之前獲得 的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù)據(jù)中所含有的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值以及 存儲在存儲器單元中的利用氨基酸濃度作為解釋變量的多變量判別式 二者,其中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中 的至少一個作為解釋變量,并評估個體中的癌癥狀態(tài),這基于所計算 的判別式值。因此,因此,在與癌癥狀態(tài)顯著相關(guān)的多變量判別式中 所獲得的判別式值可以用于達到實現(xiàn)精確評估癌癥狀態(tài)的效果。
0059根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,鑒別癌癥患者和無癌癥個體,這基于所計算的判別式值。因此, 在可以用于鑒別2組癌癥和非癌癥的多變量判別式中所獲得的判別式 值可以用于達到實現(xiàn)精確鑒別2組癌癥和非癌癥的效果。
0060根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,多變量判別式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并 且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或二者中包含 Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為 解釋變量。因此,在特別地可以用于鑒別2組癌癥和非癌癥的多變量 判別式中獲得的判別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非 癌癥的效果。
0061根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,多變量判別式是式1或式2:
a^Orn/ (Trp+Arg) +1:'" (Cys+Ile) /Leu+q (式1 )
a2xGlu/His+b2xSer/Trp+C2xVal/Ijys+dl2xPro/A]:g+e2 (式2 )
其中式1中的a!和^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0062根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估
24程序,多變量判別式是Logistic回歸方程、線性判別式、多重回歸方程、 通過支持向量才幾(Support Vector Machine)所生成的判別式、通過 Mahalanobis廣義距離方法所生成的判別式、通過典型判別式分析所生 成的判別式和通過決策樹所生成的判別式的任意一種。因此,在特別 地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判別式值 可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0063根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,多變量判別式是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解 釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln 作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys 作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。因此,在特別地可以用于鑒別 2組癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于達到實 現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0064根據(jù)本發(fā)明的癌癥評估裝置、癌癥評估方法和癌癥評估 程序,存儲在存儲器單元中的多變量判別式是根據(jù)存儲在存儲器單元 中的癌癥狀態(tài)信息而生成的,其中癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù) 和關(guān)于指示癌癥狀態(tài)指數(shù)的癌癥狀態(tài)指數(shù)數(shù)據(jù)。具體的,(l)根據(jù)預(yù) 定的判別式生成方法,從癌癥狀態(tài)信息生成候選多變量判別式;(2) 校驗所生成的候選多變量判別式,這基于預(yù)定的校驗方法;(3)基于 預(yù)定的解釋變量選擇方法,從(2)中的校驗結(jié)果選擇候選多變量判別 式中的解釋變量,這樣選擇了用于生成候選多變量判別式中的在癌癥
狀態(tài)信息中包含的氨基酸濃度組合;以及(4)根據(jù)通過重復(fù)執(zhí)行(1 )、 (2)和(3)而積累的校驗結(jié)果,從多個候選多變量判別式選擇用作 多變量判別式的候選多變量判別式,這樣生成了多變量判別式。因而, 能夠達到實現(xiàn)生成多變量判別式的效果,其最適于評估癌癥狀態(tài)(具 體的,多變量判別式,其與癌癥的狀態(tài)(疾病狀態(tài)的進展)(早期癌癥) 顯著相關(guān)(更具體的,可以用于鑒別2組癌癥和非癌癥的多變量判別 式))。
0065根據(jù)本發(fā)明的癌癥評估系統(tǒng),首先,信息通信終端裝置 將待評估的個體的氨基酸濃度數(shù)據(jù)傳輸?shù)桨┌Y評估裝置。癌癥評估裝 置接收從信息通信終端裝置傳輸?shù)膫€體的氨基酸濃度數(shù)據(jù);計算作為多變量判別式的數(shù)值的判別式值,這基于所接受的個體的氨基酸濃度
數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中
的至少 一個的濃度值以及存儲在存儲器單元中的利用氨基酸濃度作為 解釋變量的多變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量;以及評估個體中 的癌癥狀態(tài),這基于所計算的判別式值;以及將個體的評估結(jié)果傳輸 到信息通信終端裝置。接著,信息通信終端裝置接收從癌癥評估裝置 傳輸?shù)年P(guān)于癌癥狀態(tài)的個體的評估結(jié)果。因此,在與癌癥狀態(tài)顯著相 關(guān)的多變量判別式中所獲得的判別式值可以用于達到實現(xiàn)精確評估癌 癥狀態(tài)的效果。
0066根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),鑒別癌癥患者和無 癌癥個體,這基于所計算的判別式值。因此,在可以用于鑒別2組癌 癥和非癌癥的多變量判別式中所獲得的判別式值可以用于達到實現(xiàn)精 確鑒別2組癌癥和非癌癥的效果。
0067根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),多變量判別式表達 為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的 分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。因此,在特別地 可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判別式值可 以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0068根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),多變量判別式是式1 或式2:
aixOrn/(Trp+Arg)十bix (Cys+工le)/Leu+d (式1 )
a2xGlu/His+b2xSer/rrp+c2xVal/Lys+d2xPro/Arg+e2 (式2 )
其中式1中的&1和t^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和cb是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。
0069根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),多變量判別式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量枳』 (Support Vector Machine)所生成的判別式、通過Mahalanobis廣義距離 方法所生成的判別式、通過典型判別式分析所生成的判別式和通過決 策樹所生成的判別式的任意一種。因此,在特別地可以用于鑒別2組 癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于達到實現(xiàn)更 精確鑒別2組癌癥和非癌癥的效果。
0070根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),多變量判別式是利 用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic回歸方 程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別 式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic 回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量 的線性判別式。因此,在特別地可以用于鑒別2組癌癥和非癌癥的多 變量判別式中獲得的判別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥 和非癌癥的效果。
0071根據(jù)本發(fā)明的評估癌癥狀態(tài)的系統(tǒng),存儲在存儲器單元 中的多變量判別式是根據(jù)存儲在存儲器單元中的癌癥狀態(tài)信息而生成 的,其中癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù) 的癌癥狀態(tài)指數(shù)數(shù)據(jù)。具體的,(1 )根據(jù)預(yù)定的判別式生成方法,從 癌癥狀態(tài)信息生成候選多變量判別式;(2)校驗所生成的候選多變量 判別式,這基于預(yù)定的校驗方法;(3)基于預(yù)定的解釋變量選擇方法, 從(2)中的校驗結(jié)果選擇候選多變量判別式中的解釋變量,這樣選擇 了用于生成候選多變量判別式中的在癌癥狀態(tài)信息中包含的氨基酸濃 度組合;以及(4)根據(jù)通過重復(fù)執(zhí)行(1)、 (2)和(3)而積累的校 驗結(jié)果,從多個候選多變量判別式選擇用作多變量判別式的候選多變 量判別式,這樣生成了多變量判別式。因而,能夠達到實現(xiàn)生成多變 量判別式的效果,其最適于評估癌癥狀態(tài)(具體的,多變量判別式, 其與癌癥的狀態(tài)(疾病狀態(tài)的進展)(早期癌癥)顯著相關(guān)(更具體的, 可以用于鑒別2組癌癥和非癌癥的多變量判別式))。
0072根據(jù)本發(fā)明的記錄介質(zhì),計算讀取并執(zhí)行記錄在該記錄 介質(zhì)上的癌癥評估程序,這樣使得計算機可以執(zhí)行癌癥評估程序,因 此達到了在癌癥評估程序中所獲得相同的效果。
0073當在本發(fā)明中評估癌癥狀態(tài)時(具體的,進行鑒別癌癥
27和非癌癥),除了氨基酸濃度外,還可以使用其他代謝物的濃度、蛋白 質(zhì)表達水平、個體的年齡和性別等。當在本發(fā)明中評估癌癥狀態(tài)時(具 體的,進行鑒別癌癥和非癌癥),除了氨基酸濃度外,在多變量判別式 中還可以使用其他代謝物的濃度、蛋白質(zhì)表達水平、個體的年齡和性 別等作為解釋變量。
0074圖1是顯示本發(fā)明基本原理的主要配置圖。
圖2是顯示根據(jù)第一實施方式的評估癌癥狀態(tài)的一個實例的流程圖。
圖3是顯示本發(fā)明基本原理的主要配置圖。 圖4是顯示本發(fā)明整個配置的實例的圖。 圖5是顯示本發(fā)明整個配置的另一個實例的圖。 圖6是方塊圖,其顯示本發(fā)明的系統(tǒng)系統(tǒng)中癌癥評估裝置100的 配置的實例。
圖7是顯示在用戶信息檔案106a中所儲存的信息的實例的表。 圖8是顯示氨基酸濃度數(shù)據(jù)檔案106b中所儲存的信息的實例的表。
圖9是顯示癌癥狀態(tài)信息檔案106c中所儲存的信息的實例的表。 圖10是顯示指定的癌癥狀態(tài)信息檔案106d中所儲存的信息的實 例的表。
圖11是顯示候選多變量判別式檔案106el中所儲存的信息的實例 的表。
圖12是顯示校驗結(jié)果檔案106e2中所儲存的信息的實例的表。 圖13是顯示所選擇癌癥狀態(tài)信息檔案106e3中所儲存的信息的實 例的表。
圖14是顯示多變量判別式檔案106e4中所儲存的信息的實例的表。
圖15是顯示判別式值檔案106f中所儲存的信息的實例的表。 圖16是顯示評估結(jié)果檔案106g中所儲存的信息的實例的表。 圖17是顯示多變量判別式生成部分102h的配置的方塊圖。 圖18是顯示判別式標準評估部分102j的配置的方塊圖。
28圖19是顯示本發(fā)明的系統(tǒng)中客戶端裝置200的配置的實例的方塊圖。
圖20是顯示本發(fā)明的系統(tǒng)中數(shù)據(jù)庫裝置400的配置的實例的方塊圖。
圖21是顯示在本發(fā)明的系統(tǒng)中進行的癌癥評估服務(wù)處理的實例的 流程圖。
圖22是顯示本發(fā)明的系統(tǒng)中癌癥評估裝置100中進行的多變量判 別式生成處理的實例的流程圖。
圖23是顯示2組非癌癥和癌癥之間氨基酸解釋變量分布的箱線圖 (boxplot )。
圖24是顯示氨基酸解釋變量的ROC曲線的AUC的曲線圖。 圖25是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。 圖26是顯示與指數(shù)式1具有相同診斷性能的指數(shù)列表的圖表。 圖27是顯示與指數(shù)式1具有相同診斷性能的指數(shù)列表的圖表。 圖28是顯示與指數(shù)式1具有相同診斷性能的指數(shù)列表的圖表。 圖29是顯示與指數(shù)式1具有相同診斷性能的指數(shù)列表的圖表。 圖30是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。 圖31是顯示與指數(shù)式2具有相同診斷性能的指數(shù)列表的圖表。 圖32是顯示與指數(shù)式2具有相同診斷性能的指數(shù)列表的圖表。 圖33是顯示與指數(shù)式2具有相同診斷性能的指數(shù)列表的圖表。 圖34是顯示與指數(shù)式2具有相同診斷性能的指數(shù)列表的圖表。 圖35是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。 圖36是顯示與指數(shù)式3具有相同診斷性能的指數(shù)列表的圖表。, 圖37是顯示與指數(shù)式3具有相同診斷性能的指數(shù)列表的圖表。 圖38是顯示與指數(shù)式3具有相同診斷性能的指數(shù)列表的圖表。 圖39是顯示與指數(shù)式3具有相同診斷性能的指數(shù)列表的圖表。 圖40是顯示基于AUC和ROC曲線而提取的氨基酸列表的圖。 圖41是顯示癌癥患者和非癌癥患者的氨基酸解釋變量的分布的箱 線圖。
圖42是顯示氨基酸解釋變量的ROC曲線的AUC的圖。
圖43是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。
圖44是顯示與指數(shù)式4具有相同診斷性能的指數(shù)列表的圖表。
29圖45是顯示與指數(shù)式4具有相同診斷性能的指數(shù)列表的圖表。 圖46是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。 圖47是顯示與指數(shù)式5具有相同診斷性能的指數(shù)列表的圖表。 圖48是顯示與指數(shù)式5具有相同診斷性能的指數(shù)列表的圖表。 圖49是顯示2組之間評估用于診斷性能的ROC曲線的曲線圖。 圖50是顯示與指數(shù)式6具有相同診斷性能的指數(shù)列表的圖表。 圖51是顯示與指數(shù)式6具有相同診斷性能的指數(shù)列表的圖表。 圖52是顯示基于AUC和ROC曲線而提取的氨基酸列表的圖。
參數(shù)的解釋
0075100 癌癥評估裝置 102控制裝置 102a請求解釋部分 102b瀏覽處理部分 102c鑒定處理部分 102d電子郵件產(chǎn)生部分 102e網(wǎng)頁產(chǎn)生部分 102f接收部分
102g癌癥狀態(tài)信息指定部分 102h多變量判別式生成部分
102hl候選多變量判別式生成部分
102h2候選多變量判別式校驗部分
102h3解釋變量選擇部分 102i判別式值計算部分 102j判別式值標準評估部分
102jl判別式值標準評估部分 102k結(jié)果輸出部分 102m發(fā)送部分 104通信界面 106存儲器設(shè)備 106a用戶信息檔案 106b氨基酸濃度數(shù)據(jù)檔案106c癌癥狀態(tài)信息檔案 106d指定的癌癥狀態(tài)信息檔案 106e多變量判別式相關(guān)信息數(shù)據(jù)庫 106el候選多變量判別式檔案 106e2校驗結(jié)果檔案 106e3所選擇的癌癥狀態(tài)信息檔案 106e4多變量判別式檔案 106f判別式值檔案 106g評估結(jié)果檔案 108輸入/輸出界面 112輸入設(shè)備 114輸出設(shè)備200客戶端裝置(信息通信終端裝置)300網(wǎng)絡(luò)400數(shù)據(jù)庫裝置實施本發(fā)明的最佳^t式0076后面,參考附圖詳細描述本發(fā)明的評估癌癥狀態(tài)的方法 的實施方式(第一實施方式),以及本發(fā)明癌癥評估裝置、癌癥評估方 法、癌癥評估系統(tǒng)、癌癥評估程序和記錄介質(zhì)的實施方式(第二實施 方式)。本發(fā)明不限于這些實施方式。0077第一實施方式 1-1發(fā)明的概要這里,將參考圖1描述本發(fā)明的評估癌癥狀態(tài)的方法的概要。圖1 是顯示本發(fā)明的基本原理的主要配置圖表。0078在本發(fā)明中,首先測量關(guān)于從待評估個體(例如個體例 如動物或人類)收集的血液中氨基酸的濃度數(shù)值的氨基酸濃度數(shù)據(jù)(步 驟S-ll)。按照下面的方式分析血液中氨基酸的濃度。在肝素處理的管 中收集血液樣品,接著通過對所收集的血液樣品進行離心而分離血漿。 將所分離的所有血漿樣品冷凍,在測量氨基酸濃度之前儲存在-70。C。 在測量氨基酸濃度之前,通過加入硫代水楊酸達到濃度3%而對血漿樣 品進行除去蛋白質(zhì)。使用通過在后柱中使用茚三酮反應(yīng)的高效液相色譜(HPLC)的氨基酸分析儀用于測量氨基酸濃度。氨基酸濃度的單位可以是例如摩爾濃度、重量濃度,或?qū)⑦@些濃度進行加、減、乘或除 以任意常數(shù)。0079在本發(fā)明中,評估個體中的癌癥狀態(tài),這基于在步驟S-ll 中所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值(步驟S-12)。0080根據(jù)上面所述的本發(fā)明,測量關(guān)于從個體收集的血液中 氨基酸濃度值的氨基酸濃度數(shù)據(jù),并評估個體中的癌癥狀態(tài),這基于 在所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值。因此,在血液 的氨基酸中涉及癌癥狀態(tài)的氨基酸的濃度可以用于達到實現(xiàn)精確評估 癌癥狀態(tài)的效果。0081在執(zhí)行步驟S-12之前,可以從在步驟S-ll中所測量的個 體的氨基酸濃度數(shù)據(jù)移出數(shù)據(jù)例如有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù) (outlier )。進而,可以更精確地評估癌癥狀態(tài)。0082在步驟S-12中,可以鑒別癌癥患者和無癌癥個體,這基 于在步驟S-11中所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys 、 Gln、 T卬、Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值。具 體的,可以將Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的 至少一個的濃度數(shù)值與之前建立的闕值(截止值(cutoff value))進行 比較,進而鑒別癌癥患者和無癌癥個體。因此,在血液中的氨基酸中 可以用于鑒別2組癌癥和非癌癥的氨基酸的濃度,可以用于達到實現(xiàn) 精確鑒別2組癌癥和非癌癥的效果。0083在步驟S-12中,可以計算作為多變量判別式的值的判別 式值,這基于在步驟S-ll中所測量的個體的氨基酸濃度數(shù)據(jù)中所包含 的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的 濃度數(shù)值,以及之前建立的利用氨基酸濃度作為解釋變量的多變量判 別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA 中的至少一個作為解釋變量,并可以評估個體中的癌癥狀態(tài),這基于 所計算的判別式值。因此,在與癌癥狀態(tài)顯著相關(guān)的多變量判別式中 所獲得的判別式值可以用于達到實現(xiàn)精確評估癌癥狀態(tài)的效果。0084在步驟S-12中,可以計算作為多變量判別式的值的判別32式值,這基于在步驟S-ll中所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Om、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值,以及之前建立的利用氨基酸濃度作為解釋變量的多變量判 別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA 中的至少一個作為解釋變量;以及可以鑒別癌癥患者和無癌癥個體, 基于所計算的判別式值。具體的,可以將判別式值與之前建立的建立 的闕值(截止值(cutoff value ))進行比較,進而鑒別癌癥患者和無癌 癥個體。因此,在可以用于鑒別2組癌癥和非癌癥的多變量判別式中 所獲得的判別式值可以用于達到實現(xiàn)精確鑒別2組癌癥和非癌癥的效 果。0085多變量判別式表達為一個分數(shù)式,或者多個分數(shù)式的總 和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或二者 中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一 個作為解釋變量。具體的,多變量判別式可以是式1或式2:apOrn/ (Trp+Arg) +1^ (Cys+Ile) /Leu+d (式1 )a2xGlu/His+b2xSer/Trp+c2xVal/:Lys+d2xPro/A]:g+e2 (式2 )其中式1中的a!和h是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果??梢?通過在國際公開WO 2004/052191中所描述的方法,或者通過在國際申 請WO 2006/098192中所描述的方法(在后面所描述的第二實施方式中 所描述的多變量判別式生成處理)生成上述的多變量判別式,其中, 國際公開WO 2004/052191是由本發(fā)明的申請人提交的國際申請,國際 申請WO 2006/098192是由本發(fā)明的申請人提交的國際申請。優(yōu)選使用 通過這些方法獲得的所有多變量判別式用于評估癌癥狀態(tài),而與在作 為輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù)中氨基酸濃度的單位無關(guān)。0086在分數(shù)式中,分數(shù)式的分子表達為氨基酸A、 B、 C等的 總和。分數(shù)式的墳?zāi)贡磉_為氨基酸a、 b、 b等的總和。分數(shù)式還包括33具有這些構(gòu)成的分數(shù)式a、卩、Y等的總和(例如a+卩)。分數(shù)式還包括 相除(divided)的分數(shù)式。用于分子或分母的氨基酸可以分別具有適 當?shù)南禂?shù)。用于分子或分母的氨基酸可以重復(fù)出現(xiàn)。每個分數(shù)式可以 具有適當?shù)南禂?shù)。每個解釋變量的系數(shù)的數(shù)值,和常數(shù)的數(shù)值可以是 任意實數(shù)。在分數(shù)式中分子中的解釋變量和分母中的解釋變量相互切 換的組合中,正(或負)符號通常會根據(jù)目標解釋變量而轉(zhuǎn)換,但因 為保持它們的關(guān)系,所以這些組合可以被認為在養(yǎng)別中與另 一種是等 價的,因此分數(shù)式還包括分數(shù)式中分子中的解釋變量和分母中的解釋 變量的組合相互切換的組合。0087多變量判別式可以是Logistic回歸方程、線性判別式、多 重回歸方禾呈、通過支4爭向量才幾(Support Vector Machine)所生成的判別 式、通過Mahalanobis廣義距離方法所生成的判別式、通過典型判別式的,多變量判別式可以是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為 解釋變量的Logistic回歸方禾呈,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln 作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys 作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。因此,在特別地可以用于鑒別 2組癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于達到實 現(xiàn)更精確鑒別2組癌癥和非癌癥的效果??梢酝ㄟ^在國際申請WO 2006/098192中所描述的方法(在后面所描述的笫二實施方式中所描述 的多變量判別式生成處理)生成上述的多變量判別式,其中,國際申 請WO 2006/098192是由本發(fā)明的申請人提交的國際申請。優(yōu)選使用通 過這些方法獲得的所有多變量判別式用于評估癌癥狀態(tài),而與在作為 輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù)中氨基酸濃度的單位無關(guān)。0088多變量判別式是指通常用于多變量分析的方程形式,包 括例如多重回歸方程、多重Logistic回歸方程、線性判別式函數(shù)、 Mahalanobis廣義距離、典型判別式函數(shù)、支持向量機(Support Vector Machine)和決策樹。多變量判別式還包括通過不同形式多變量判別式的 總和而顯示的方程。在多重回歸方程、多重Logistic回歸方程和典型判 別式函數(shù)中,向每個解釋變量加入系數(shù)和常數(shù),并且在這種情況中優(yōu) 選系數(shù)和常數(shù)是實數(shù),更優(yōu)選在從用于鑒別的數(shù)據(jù)獲得的系數(shù)和常數(shù)34的99%置信區(qū)間范圍內(nèi)的數(shù)值,更優(yōu)選在從用于鑒別的數(shù)據(jù)獲得的系數(shù)和常數(shù)的95%置信區(qū)間范圍內(nèi)的數(shù)值。每個系數(shù)的數(shù)值和其置信區(qū) 間可以乘以實數(shù),并且每個常數(shù)的數(shù)值和其置信區(qū)間可以加、減任意 真實的常數(shù),或者乘以或除以任意真實的常數(shù)。0089在本發(fā)明中評估癌癥狀態(tài)時(具體的,進行鑒別癌癥和 非癌癥),除了氨基酸濃度外,還可以使用其他代謝物的濃度、蛋白質(zhì) 表達水平、個體的年齡和性別等。當在本發(fā)明中評估癌癥狀態(tài)時(具 體的,進行鑒別癌癥和非癌癥),除了氨基酸濃度外,在多變量判別式 中還可以使用其他代謝物的濃度、蛋白質(zhì)表達水平、個體的年齡和性 別等作為解釋變量。00901-2.才艮據(jù)第一實施方式的評估癌癥狀態(tài)的方法 這里,參考圖2描述根據(jù)第一實施方式的評估癌癥狀態(tài)的方法。 圖2是顯示根據(jù)第 一 實施方式的評估癌癥狀態(tài)的 一 個實例的流程圖。0091從自個體例如動物或人類收集的血液,測量關(guān)于氨基酸 濃度值的氨基酸濃度數(shù)據(jù)(步驟SA-ll)。通過上面所述的方法進行氨 基酸濃度值的測量。0092從步驟SA-ll中所測量的個體的氨基酸濃度數(shù)據(jù),移出 數(shù)據(jù)例如有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù)(步驟SA-12)。0093接著,將已經(jīng)移出有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù)的氨基酸 濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA 中的至少一個的濃度數(shù)值與之前建立的闕值(截止值(cutoff value )) 進行比較,這樣鑒別個體中的癌癥和非癌癥;或者計算判別式數(shù)值, 這基于步驟SA-12中已經(jīng)移出有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù)的個體的氨 基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser 和ABA中的至少一個的濃度數(shù)值以及之前建立的含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量的多變 量判別式二者,以及將所計算的判別式值與之前建立的闕值(截止值(cutoff value ))進行比較,這樣鑒別個體中的癌癥和非癌癥(步驟 SA-13)。00941-3第一實施方式和其他實施方式的總結(jié) 在上面詳細描述的評估癌癥狀態(tài)的方法中,(1 )從自個體收集的 血液測量氨基酸濃度數(shù)據(jù),(2)從個體的所測量氨基酸濃度數(shù)據(jù)移出數(shù)據(jù)例如有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù),和(3)將已經(jīng)移出有缺陷的數(shù)據(jù)和無關(guān)的數(shù)據(jù)的個體氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值與之前建 立的闕值(截止值(cutoff value ))進行比較,這樣鑒別個體中的癌癥 和非癌癥,或者計算判別式數(shù)值,這基于已經(jīng)移出有缺陷的數(shù)據(jù)和無 關(guān)的數(shù)據(jù)的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值以及之前建立的 含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個 作為解釋變量的多變量判別式二者,以及將所計算的判別式值與之前 建立的闕值(截止值(cutoffvalue))進行比較,這樣鑒別個體中的癌 癥和非癌癥。因此,在血液中的氨基酸中可以用于鑒別2組癌癥和非癌癥的氨基酸濃度,以及在可以用于鑒別2組癌癥和非癌癥的多變量 判別式中所獲得的判別式值可以用于達到實現(xiàn)精確鑒別2組癌癥和非 癌癥的效果。0095在步驟SA-13中,多變量判別式可以表達為一個分數(shù)式, 或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和 分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser 和ABA中的至少一個作為解釋變量。具體的,多變量判別式可以是式 1或式2:aixOrn/ (Trp+Arg) +bix (Cys+Ile) /Leu+a (式1 )a2xGlu/His+b2xSer/Trp+C2xVal/Lys+d2xPro/Arg+e2 (式2 )其中式1中的a!和bh是任意非零實數(shù),式1中的C!是任意實數(shù),式2 中的a2、 b2、 q和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于筌別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。可以 通過在國際7〉開WO 2004/052191中所描述的方法,或者通過在國際申 請WO 2006/098192中所描述的方法(在后面所描述的第二實施方式中 所描述的多變量判別式生成處理)生成上述的多變量判別式,其中, 國際公開WO 2004/052191是由本發(fā)明的申請人提交的國際申請,國際申請WO 2006/098192是由本發(fā)明的申請人提交的國際申請。優(yōu)選使用 通過這些方法獲得的所有多變量判別式用于評估癌癥狀態(tài),而與在作 為輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù)中氨基酸濃度的單位無關(guān)。0096在步驟SA-13中,多變量判別式可以是Logistic回歸方程、 線性判別式、多重回歸方程、通過支持向量機(Support Vector Machine) 所生成的判別式、通過Mahalanobis廣義距離方法所生成的判別式、通 過典型判別式分析所生成的判別式和通過決策樹所生成的判別式的任 意一種。具體的,多變量判別式可以是利用Orn、 Cys、 Tau、 Trp、 Gln、 和Cit作為解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸方程,或者利用Glu、Ala、ABA、 Val、 His和Orn作為解釋變量的線性判別式。因此,在特別地可以用 于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于 達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果??梢酝ㄟ^在國際申請 WO 2006/098192中所描述的方法(在后面所描述的第二實施方式中所 描述的多變量判別式生成處理)生成上述的多變量判別式,其中,國 際申請WO 2006/098192是由本發(fā)明的申請人提交的國際申請。優(yōu)選使 用通過這些方法獲得的所有多變量判別式用于評估癌癥狀態(tài),而與在 作為輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù)中氨基酸濃度的單位無關(guān)。0097第二實施方式 2-l.發(fā)明的概要這里,參考圖3對本發(fā)明的癌癥評估裝置、癌癥評估方法、癌癥 評估系統(tǒng)、癌癥評估程序和記錄介質(zhì)進行詳細描述。圖3是顯示本發(fā) 明基本原理的主要配置圖表。0098在本發(fā)明中,在控制設(shè)備中計算作為多變量判別式的數(shù) 值的判別式值,這基于在之前所獲得的待評估個體(例如,個體如動 物或人類)的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度數(shù)值以及存儲在存儲器設(shè) 備中的利用氨基酸濃度作為解釋變量的之前建立的多變量判別式二 者,其中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的 至少一個作為解釋變量(步驟S-21 )。30099在本發(fā)明中,在控制設(shè)備中評估個體中的癌癥狀態(tài),這 基于在步驟S-21中所計算的判別式值(步驟S-22)。0100根據(jù)上面所描述的本發(fā)明,計算作為多變量判別式的數(shù) 值的判別式值,這基于在之前所獲得的個體的氨基酸濃度數(shù)據(jù)中所包 含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個 的濃度數(shù)值以及存儲在存儲器設(shè)備中的利用氨基酸濃度作為解釋變量 的之前建立的多變量判別式二者,其中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量;以及評估個體中 的癌癥狀態(tài),這基于所計算的判別式值。因此,在與癌癥狀態(tài)顯著相 關(guān)的多變量判別式中所獲得的判別式值可以用于達到實現(xiàn)精確評估癌 癥狀態(tài)的效果。0101在步驟S-22中,可以鑒別癌癥患者和無癌癥個體,這基 于在步驟S-21中所計算的判別式值。具體的,可以將判別式值與之前 建立的闕值(截止值(cutoff value ))進行比較,進而鑒別癌癥患者和 無癌癥個體。因此,在血液中的氨基酸中可以用于鑒別2組癌癥和非 癌癥的氨基酸的濃度,可以用于達到實現(xiàn)精確鑒別2組癌癥和非癌癥 的效果。0102多變量判別式可以表達為一個分數(shù)式,或者多個分數(shù)式 的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或 二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至 少一個作為解釋變量。具體的,多變量判別式可以是式1或式2:a^Orn/ (Trp+Arg)十b^ (Cys+Ile) /Leu+Ci (式1 )a2xGlu/His+b2xSer/Trp+c2xVal/Lys+d2xpro/Arg+e2 (式2)其中式1中的a!和l^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于筌別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。可以 通過在國際公開WO 2004/052191中所描述的方法,或者通過在國際申 請WO 2006/098192中所描述的方法(后面所描述的多變量判別式生成38處理)生成上述的多變量判別式,其中,國際公開WO 2004/052191是 由本發(fā)明的申請人提交的國際申請,國際申請WO 2006/098192是由本 發(fā)明的申請人提交的國際申請。優(yōu)選使用通過這些方法獲得的所有多 變量判別式用于評估癌癥狀態(tài),而與在作為輸入數(shù)據(jù)的氨基酸濃度數(shù) 據(jù)中氨基酸濃度的單位無關(guān)。0103在分數(shù)式中,分數(shù)式的分子表達為氨基酸A、 B、 C等的 總和,分數(shù)式的墳?zāi)贡磉_為氨基酸a、 b、 c等的總和。分數(shù)式還包括具 有這些構(gòu)成的分數(shù)式a、卩、y等的總和(例如a+卩)。分數(shù)式還包括相 除(divided)的分數(shù)式。用于分子或分母的氨基酸可以分別具有適當 的系數(shù)。用于分子或分母的氨基酸可以重復(fù)出現(xiàn)。每個分數(shù)式可以具 有適當?shù)南禂?shù)。每個解釋變量的系數(shù)的數(shù)值,和常數(shù)的數(shù)值可以是任 意實數(shù)。在分數(shù)式中分子中的解釋變量和分母中的解釋變量相互切換 的組合中,正(或負)符號通常會根據(jù)目標解釋變量而轉(zhuǎn)換,但因為 保持它們的關(guān)系,所以這些組合可以被認為在鑒別中與另 一種是等價 的,因此分數(shù)式還包括分數(shù)式中分子中的解釋變量和分母中的解釋變 量的組合相互切換的組合。0104多變量判別式可以是Logistic回歸方程、線性判別式、多 重回歸方程、通過支持向量機(Support Vector Machine)所生成的判別 式、通過Mahalanobis廣義距離方法所生成的判別式、通過典型判別式的,多變量判別式可以是利用Om、 Cys、 Tau、 Trp、 Gln、和Cit作為 解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln 作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys 作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。因此,在特別地可以用于鑒別 2組癌癥和非癌癥的多變量判別式中獲得的判別式值可以用于達到實 現(xiàn)更精確鑒別2組癌癥和非癌癥的效果??梢酝ㄟ^在國際申請WO 2006/098192中所描述的方法(后面所描述的多變量判別式生成處理) 生成上述的多變量判別式,其中,國際申請WO 2006/098192是由本發(fā) 明的申請人提交的國際申請。優(yōu)選使用通過這些方法獲得的所有多變 量判別式用于評估癌癥狀態(tài),而與在作為輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù) 中氨基酸濃度的單位無關(guān)。0105多變量判別式是指通常用于多變量分析的方程形式,包括例如多重回歸方程、多重Logistic回歸方程、線性判別式函數(shù)、 Mahalanobis廣義距離、典型判別式函數(shù)、支持向量機(Support Vector Machine)和決策樹。多變量判別式還包括通過不同形式多變量判別式的 總和而顯示的方程。在多重回歸方程、多重Logistic回歸方程和典型判 別式函數(shù)中,向每個解釋變量加入系數(shù)和常數(shù),并且在這種情況中優(yōu) 選系數(shù)和常數(shù)是實數(shù),更優(yōu)選在從用于鑒別的數(shù)據(jù)獲得的系數(shù)和常數(shù) 的99%置信區(qū)間范圍內(nèi)的數(shù)值,更優(yōu)選在從用于鑒別的數(shù)據(jù)獲得的系 數(shù)和常數(shù)的95%置信區(qū)間范圍內(nèi)的數(shù)值。每個系數(shù)的數(shù)值和其置信區(qū) 間可以乘以實數(shù),并且每個常數(shù)的數(shù)值和其置信區(qū)間可以加、減任意 真實的常數(shù),或者乘以或除以任意真實的常數(shù)。0106在本發(fā)明中評估癌癥狀態(tài)時(具體的,進行鑒別癌癥和 非癌癥),除了氨基酸濃度外,還可以使用其他代謝物的濃度、蛋白質(zhì) 表達水平、個體的年齡和性別等。當在本發(fā)明中評估癌癥狀態(tài)時(具 體的,進行鑒別癌癥和非癌癥),除了氨基酸濃度外,在多變量判別式 中還可以使用其他代謝物的濃度、蛋白質(zhì)表達水平、個體的年齡和性 別等作為解釋變量。0107這里,對多變量判別式生成處理(步驟1~4)的總結(jié)進 4亍i羊細4苗述。0108首先,在控制設(shè)備,從存儲在存儲器設(shè)備中包括氨基酸 濃度數(shù)據(jù)和涉及顯示癌癥狀態(tài)的指數(shù)的癌癥狀態(tài)指數(shù)數(shù)據(jù),生成作為 多變量判別式候選的候選多變量判別式多變量判別式(例如,y = ai xi+ a2x2+. , , + anxn, y:癌癥狀態(tài)指數(shù)數(shù)據(jù),Xi:氨基酸濃度 數(shù)據(jù),ai:常數(shù),i = 1 , 2 , ■ ■ ■ , n ),其通過預(yù)定的判別式生成 方法(步驟1)。含有有缺陷數(shù)據(jù)和無關(guān)數(shù)據(jù)的數(shù)據(jù)可以從癌癥狀態(tài)信 息中提前被移出。0109在步驟1中,可以從癌癥狀態(tài)信息生成多種候選多變量 判別式,其通過使用多種不同的判別式生成方法(包括用于多變量分 析的那些,例如主成分分析、判別式分析、支持向量機、多重回歸分 析、Logistic回歸分析、K-均值法、聚類分析(Cluster Analysis)和決定 樹)。具體的,可以同時且并行地生成多個候選多變量判別式組,其通 過使用多個不同的運算法則,利用作為通過分析來自大量健康個體和癌癥患者的氨基酸濃度數(shù)據(jù)和癌癥狀態(tài)指數(shù)數(shù)據(jù)鎖構(gòu)成的多變量數(shù)據(jù) 的癌癥狀態(tài)信息。例如,可以通過同時利用不同的運算法則進行判別 式分析和Logistic回歸分析形成不同的候選多變量判別式。可替換的, 可以利用通過進行主成分分析候選多變量判別式,通過轉(zhuǎn)化癌癥狀態(tài) 信息,接著對經(jīng)轉(zhuǎn)化的癌癥狀態(tài)信息進行判別式分析,而形成候選多 變量判別式。以這種方式,可以最終生成適于診斷條件的多變量判別 式。0110通過主成分生成的候選多變量判別式是線性表達式,其由氨基酸解釋變量構(gòu)成,使得所有氨基酸濃度數(shù)據(jù)的變化最大化。通過判別式分析生成的候選多變量判別式是高冪表達式(high powered expression)(包括指數(shù)和對數(shù)表達式),其由氨基酸解釋變量構(gòu)成,在 每個組中所有氨基酸濃度數(shù)據(jù)的變化中的變化總和的比例最小化。通 過使用支持向量機生成的候選多變量判別式是高冪表達式(high powered expression )"(核函數(shù)),其由氨基酸解釋變量構(gòu)成,使得組 之間的邊界最大化。通過多重回歸分析生成的候選多變量判別式是是 高冪表達式,其由氨基酸解釋變量構(gòu)成,使得來自所有氨基酸濃度數(shù) 據(jù)的距離的總和最小化。通過Logistic回歸分析生成的候選多變量判別 式是分數(shù)式,其具有作為成分的具有線性表達的自然對數(shù),其由氨基 酸解釋變量構(gòu)成,這使得與冪函數(shù)的相似性最大化。k-均值方法是一種 方法,其尋找各個組中相鄰氨基酸數(shù)據(jù)的k塊(pieces),指定該組含 有最大數(shù)目的相鄰點作為擁有數(shù)據(jù)的組,以及選擇氨基酸解釋變量, 其使得輸入氨基酸濃度數(shù)據(jù)的組與所指定的組完全符合。聚類分析是 一種將整個氨基酸濃度數(shù)據(jù)中最接近的點聚類(分組)的方法。決定 樹是一種方法,其將氨基酸解釋變量分類,并從較高等級氨基酸解釋 變量所可能保持的模式預(yù)測氨基酸濃度數(shù)據(jù)的組。0111返回到多變量判別式生成處理的描述,在控制設(shè)備中通 過特定的校驗方法對步驟1中生成的候選多變量判別式進行校驗(交 互校驗)(步驟2)。對步驟l中生成的候選多變量判別式,相互進行候 選多變量判別式的校驗。0112在步驟2中,可以通過Bootstrap方法、保持評判方法 (holdout method )、 留 一方法(leave one out method)等的至少 一種對 候選多變量判別式的鑒別率、靈敏度、信息標準等進行校驗。以這種41和診斷條件,可以生成可預(yù)測性或可靠 性更高的候選多變量判別式。0113鑒別率是根據(jù)本發(fā)明評估的癌癥狀態(tài)在所有輸入數(shù)據(jù)中 都正確的數(shù)據(jù)的比例。靈敏度是在輸入數(shù)據(jù)中聲明癌癥的癌癥狀態(tài)中 根據(jù)本發(fā)明判斷正確的癌癥狀態(tài)的比例。特異性是在輸入數(shù)據(jù)中描述 健康的癌癥狀態(tài)中根據(jù)本發(fā)明判斷正確的癌癥狀態(tài)的比例。信息標準 是在步驟1中生成的候選多變量判別式中氨基酸解釋變量的數(shù)目,以 及根據(jù)本發(fā)明評估的癌癥狀態(tài)與輸入數(shù)據(jù)中所描述的癌癥狀態(tài)的數(shù)目 的差異的總和??深A(yù)測性是通過重復(fù)校驗候選多變量判別式所獲得的, 鑒別率、靈敏度或特異性的平均。可替換的,可靠性是通過重復(fù)校驗 候選多變量判別式所獲得的,鑒別率、靈敏度或特異性的變化。0114返回到多變量判別式生成處理的描述,在控制設(shè)備中根據(jù)預(yù)定的解釋變量選擇方法,選擇用于生成候選多變量判別式中的癌癥狀態(tài)信息中所包含的氨基酸濃度數(shù)據(jù)的組合,其通過選擇來自步驟2 中的校驗結(jié)果的候選多變量判別式的解釋變量(步驟3)。對步驟1中 生成的每個候選多變量判別式進行氨基酸解釋變量的選擇。以這種方 式,可以正確選擇候選多變量判別式的氨基酸解釋變量。通過使用包 括在步驟3中選擇的氨基酸濃度數(shù)據(jù)的癌癥狀態(tài)信息再次執(zhí)行步驟1.0115從步驟2中的校驗結(jié)果,可以在步驟3中選擇候選多變 量判別式的氨基酸解釋變量,這基于逐步方法、最佳路徑方法(best path method )、局部檢索方法和遺傳運算法則的至少 一種。0116最佳路徑方法是選擇氨基酸解釋變量的方法,其通過優(yōu) 化候選多變量判別式的評估指數(shù),同時逐個消除候選多變量判別式中 所包含的候選多變量判別式。0117返回到多變量判別式生成處理的描述,在控制設(shè)備中重 復(fù)進行步驟l、 2和3,并基于這樣所積累的校驗結(jié)果,從多種候選多 變量判別式選擇用作多變量判別式的候選多變量判別式,這樣生成了 多變量判別式(步驟4)。在候選多變量判別式的選擇中,存在從所生 成的候選多變量判別式以相同的方式選擇最佳多變量判別式的情況, 或者從所有候選多變量判別式選擇最佳多變量判別式。0118正如上面所述的,生成候選多變量判別式、候選多變量 判別式的校驗以及選擇候選多變量判別式中的解釋變量的處理,是基于多變量判別式生成中以系統(tǒng)化方式在 一些列操作中的癌癥狀態(tài)信息 進行的,這樣,可以生成最佳多變量判別式用于癌癥狀態(tài)的評估。01192-2系統(tǒng)配置后面,將參考圖4~20對根據(jù)本發(fā)明第二實施方式的癌癥評估系 統(tǒng)(后面有時也稱作本發(fā)明的系統(tǒng))的配置進行描述。該系統(tǒng)僅僅是 一個實例,本發(fā)明并不限于此。0120首先,參考圖4和5描述本發(fā)明的系統(tǒng)的整個配置。圖4 是顯示本發(fā)明的系統(tǒng)結(jié)構(gòu)的整個配體的實例的圖。圖5是顯示本發(fā)明 的系統(tǒng)結(jié)構(gòu)的整個配體的另一個實例的圖。正如圖4中所顯示的,本 發(fā)明的系統(tǒng)被構(gòu)建成,癌癥評估裝置IOO和客戶端裝置200 (對應(yīng)本發(fā) 明的信息通信終端裝置)通過網(wǎng)絡(luò)300相互通信連接,其中癌癥評估 裝置100評估待評估個體中的癌癥狀態(tài),客戶端200提供關(guān)于個體中 氨基酸濃度值的氨基酸濃度數(shù)據(jù)。0121在圖5所顯示的本發(fā)明的系統(tǒng)中,除了癌癥評估裝置100 和客戶端裝置200外,數(shù)據(jù)庫裝置400也可以通過網(wǎng)絡(luò)300通信連接, 其中數(shù)據(jù)庫裝置400存儲例如用于生成多變量判別式的癌癥狀態(tài)信息, 和用于在癌癥評估裝置100中評估癌癥狀態(tài)的多變量判別式。在該配 置中,通過網(wǎng)絡(luò)300將關(guān)于癌癥狀態(tài)等的信息從癌癥評估裝置100提 供到客戶端裝置200和數(shù)據(jù)庫裝置400,或者從客戶端裝置200和數(shù)據(jù) 庫裝置400提供到癌癥評估裝置100。"關(guān)于癌癥狀態(tài)的信息"是關(guān)于生 物體包括人類的癌癥狀態(tài)的特定項目的所測量數(shù)值的信息。在癌癥評 估裝置100、客戶端裝置200和其他裝置(例如各個測量裝置)中產(chǎn)生 關(guān)于癌癥狀態(tài)的信息,并主要存儲在數(shù)據(jù)庫數(shù)據(jù)庫裝置400中。0122現(xiàn)在,參考圖6~ 18描述本發(fā)明的系統(tǒng)中的癌癥評估裝 置100的配置。圖6是顯示本發(fā)明的系統(tǒng)中癌癥評估裝置100的配置 的實例的方塊圖,其僅僅大概顯示了與本發(fā)明相關(guān)的區(qū)域。0123癌癥評估裝置100包括控制設(shè)備102例如CPU (中央處 理器),其整合地控制癌癥評估裝置100;通信界面104,其將癌癥評 估裝置100通過通信裝置連接到網(wǎng)絡(luò)300,其中通信裝置例如路由器和 有線或無線連接線路如專用線;存儲器設(shè)備106,其存儲各種數(shù)據(jù)庫、 表、檔案等;以及輸入/輸出界面108,其連接到通過任何通信通道相 互通信連接的輸入設(shè)備112和輸出設(shè)備114。癌癥評估裝置100可以與各種分析器在相同的構(gòu)架中共同存在(例如氨基酸分析器)。癌癥評估 裝置100的分解/整合的典型配置并不限于在圖中所顯示的,并且且全 部或一部分都可以在功能或物理上以任何單位分解或整合,例如根據(jù) 所施加的各種負荷。例如,可以通過CGI (通用網(wǎng)關(guān)接口 )進行一部 分處理。0124存儲器設(shè)備106是存儲手段,其例子包括存儲器裝置例 如RAM (隨機存取存儲器)和ROM (只讀存儲器)、硬盤驅(qū)動器例如 硬盤、移動硬盤、光盤等。存儲器設(shè)備106存儲計算機程序,其連同 OS (操作系統(tǒng))為CPU提供指令進行各種處理。正如圖中所示,存儲 器設(shè)備106存儲用戶信息檔案106a、氨基酸濃度數(shù)據(jù)檔案106b、癌癥 狀態(tài)信息檔案106c、指定的癌癥狀態(tài)信息檔案106d、多變量判別式相 關(guān)信息數(shù)據(jù)庫106e、判別式值檔案106f和評估結(jié)果檔案106g。0125用戶信息檔案106a存儲關(guān)于用戶的用戶信息。圖7是顯 示在用戶信息檔案106a中所儲存的信息的實例的表。正如圖7中所示, 在用戶信息檔案106a中存儲的信息包括相互關(guān)聯(lián)的用戶ID(身份)用 于唯一地識別用戶、用戶密碼用于鑒定用戶、用戶姓名、組織ID用于 唯一地識別用戶的組織、部門ID用于唯一地識別用戶組織的部門、部 門名稱和用戶的電子郵件地址。0126返回到圖6,氨基酸濃度數(shù)據(jù)檔案106b存儲關(guān)于氨基酸 濃度值的氨基酸濃度數(shù)據(jù)。圖8是顯示氨基酸濃度數(shù)據(jù)檔案106b中所 儲存的信息的實例的表。正如圖8中所示,在氨基酸濃度數(shù)據(jù)檔案106b 中存儲的信息包括相互關(guān)聯(lián)的個體編號用于唯 一 地識別個體(樣品) 為待評估的個體和氨基酸濃度數(shù)據(jù)。在圖8中,氨基酸濃度數(shù)據(jù)被假 定為數(shù)字數(shù)值即在連續(xù)尺度(continuous scale )上,但氨基酸濃度數(shù)據(jù) 可以在名義尺度(nominal scale )或順序尺度(ordinal scale )上表達。 在名義尺度和順序尺度的情況中,可以分配任何數(shù)字進行分析。氨基 酸濃度數(shù)據(jù)可以與其他生物信息組合(例如性別差異、年齡、吸煙、 數(shù)字化心電圖波形、酶濃度、基因表達水平和氨基酸以外的代謝物的 濃度)。0127返回到圖6,癌癥狀態(tài)信息檔案106c存儲用于生成多變 量判別式的癌癥狀態(tài)信息。圖9圖9是顯示癌癥狀態(tài)信息檔案106c中 所儲存的信息的實例的表。正如圖9中所顯示的,癌癥狀態(tài)信息檔案44106C中所儲存的信息包括相互關(guān)聯(lián)的個體(樣品)編號、對應(yīng)癌癥狀態(tài)指數(shù)的癌癥狀態(tài)指數(shù)數(shù)據(jù)(T)(指數(shù)T!、指數(shù)丁2、指數(shù)T3...)以及 氨基酸濃度數(shù)據(jù)。在圖9中,癌癥狀態(tài)指數(shù)數(shù)據(jù)被假定為數(shù)字數(shù)值即 在連續(xù)尺度(continuous scale )上,但癌癥狀態(tài)指數(shù)數(shù)據(jù)可以在名義尺 度(nominal scale )或順序尺度(ordinal scale )上表達。在名義尺度和 順序尺度的情況中,可以為每種狀態(tài)分配任何數(shù)字進行分析。癌癥狀 態(tài)指數(shù)數(shù)據(jù)是已知的單個狀態(tài)指數(shù),其作為癌癥狀態(tài)的標記,并且可 以使用數(shù)字數(shù)據(jù)。0128返回到圖6,指定的癌癥狀態(tài)信息檔案106d存儲在下面 所描述的癌癥狀態(tài)信息指定部分102g中所制定的癌癥狀態(tài)信息。圖10 是顯示指定的癌癥狀態(tài)信息檔案106d中所儲存的信息的實例的表。正 如圖10中所顯示的,指定的癌癥狀態(tài)信息檔案106d中所儲存的信息 包括相互關(guān)聯(lián)的個體編號、指定的癌癥狀態(tài)指數(shù)數(shù)據(jù)和指定的氨基酸 濃度數(shù)據(jù)。0129返回到圖6,多變量判別式相關(guān)信息數(shù)據(jù)庫106e包括候 選多變量判別式檔案106el,其存儲在下面所描述的候選多變量判別式 生成部分102hl中所生成的候選多變量判別式;校驗結(jié)果檔案106e2, 其存儲在下面所描述的候選多變量判別式校驗部分102h2中的校驗結(jié) 果;所選擇的癌癥狀態(tài)信息檔案106e3,其存儲含有在下面所描述的解 釋變量選擇部分102h3中選擇的氨基酸濃度數(shù)據(jù)組合的癌癥狀態(tài)信息; 多變量判別式檔案106e4,其存儲在下面所描述的多變量判別式生成部 分102h中所生成的多變量判別式。0130候選多變量判別式檔案存儲在下面所描述的候選多變量 判別式生成部分102hl中所生成的候選多變量判別式。圖ll是顯示候 選多變量判別式檔案106el中所儲存的信息的實例的表。正如圖11中 所顯示的,候選多變量判別式檔案106el中存儲的信息包括相互關(guān)聯(lián) 的排序和候選多變量判別式(例如圖11中的Fi ( G 1 y , Leu, P he,. ■ )、 F2(Gly, Leu, Phe,, )、 F3(Gly, Leu, Phe,. ■ ))。0131返回到圖6,校驗結(jié)果檔案106e2存儲在下面所描述的候 選多變量判別式校驗部分102h2中的校驗結(jié)果圖12是顯示校驗結(jié)果檔 案106e2中所儲存的信息的實例的表。正如圖12中所顯示的,校驗結(jié)果檔案106e2中存儲的信息包括相互關(guān)聯(lián)的排序和候選多變量判別式 (例如圖12中的Fk ( G 1 y , Leu, P h e , ■ ' )、 Fm ( G 1 y, Leu, Phe,.…)、F丄(Gly, Leu, Phe,…,))以及每個候選多變量判別式的校驗結(jié)果(例如每個候選多變量判別式的評估值)。0132返回到圖6,所選擇的癌癥狀態(tài)信息檔案106e3存儲含有 在下面所描述的解釋變量選擇部分102h3中選擇的氨基酸濃度數(shù)據(jù)組 合的癌癥狀態(tài)信息。圖13是顯示所選擇癌癥狀態(tài)信息檔案106e3中所 儲存的信息的實例的表。正如圖13中所顯示的,所選擇癌癥狀態(tài)信息 檔案106e3中所儲存的信息包括相互關(guān)聯(lián)的個體編號、在下面所描述 的癌癥狀態(tài)信息指定部分102g中指定的癌癥狀態(tài)指數(shù)數(shù)據(jù)以及在釋變 量選擇部分102h3中所選擇的氨基酸濃度數(shù)據(jù)。0133返回到圖6,多變量判別式檔案106e4,存儲在下面所描 述的多變量判別式生成部分102h中所生成的多變量判別式。圖14是 顯示多變量判別式檔案106e4中所儲存的信息的實例的表。正如圖14 中所顯示的,多變量判別式檔案106e4中所儲存的信息包括相互關(guān)聯(lián) 的排序和多變量判別式(例如圖14中的Fp( P h e ,■ ' )、 Fp(G ly, Leu, Phe)、 Fk(Gly, Leu, Phe,. ■ ))、 對應(yīng)每種判別式生成方法的闕值和每個多變量判別式的校驗結(jié)果(例 如每個多變量判別式的評估值)。0134返回到圖6,判別式值檔案106f存儲在下面所描述的判 別式值計算部分102i中計算的判別式值。圖15是顯示判別式值檔案 106f中所儲存的信息的實例的表。正如圖15中所顯示的,判別式值檔 案106f中所儲存的信息包括相互關(guān)聯(lián)的個體編號用于唯一地識別個體 (樣品)作為待評估的個體,排序(用于唯一地識別多變量判別式的 編號)和判別式值。0135返回到圖6,評估結(jié)果檔案106g存儲在下面所描述的判 別式值標準評估部分102j中所獲得的評估結(jié)果(具體地,在判別式值 標準評估部分102J1中獲得的鑒別結(jié)果)。圖16是顯示評估結(jié)果檔案 106g中所儲存的信息的實例的表。評估結(jié)果檔案106g中所儲存的信息 包括相互關(guān)聯(lián)的個體編號用于唯一地識別個體(樣品)作為待評估的 個體,之前獲得的關(guān)于待評估個體的氨基酸濃度數(shù)據(jù)和關(guān)于癌癥狀態(tài)關(guān)于鑒別癌癥和非癌癥的鑒別結(jié)果)。0136返回到圖6,存儲器設(shè)備106存儲各種網(wǎng)頁數(shù)據(jù)、CGI程 序等用于為客戶端裝置200提供關(guān)于上面所述信息以外信息的網(wǎng)站信 息。網(wǎng)頁數(shù)據(jù)包括各種數(shù)據(jù)用于展示下面所描述的網(wǎng)頁等,數(shù)據(jù)作為 例如HTML (超文本標志語言)或XML (可擴展標記語言)文本檔案。 其他臨時文件例如用于產(chǎn)生網(wǎng)頁數(shù)據(jù)和用于操作的組分的檔案等也被 存儲在存儲器設(shè)備106中。此外,根據(jù)需要可以以WAVE或AIFF (音 頻交換文件格式)格式的聲音信號用于傳輸?shù)娇蛻舳搜b置200,以及 JPEG (聯(lián)合圖像專家組)或MPEG2 (運動圖像專家組相2)格式的靜 態(tài)或動態(tài)圖片的圖像檔案。0137通信界面104允許在癌癥評估裝置100與網(wǎng)絡(luò)300 (或通 信裝置例如路由器)之間通信。因此,通信界面104具有通過通信線 路與其他終端通信數(shù)據(jù)的功能。0138輸入/輸出界面108連接到輸入設(shè)備102和輸出設(shè)備114。 顯示器(包括家用電視)、揚聲器或打印機可以用作輸出設(shè)備14 (后 面輸出設(shè)備114也可以被描述為顯示器114)。鍵盤、鼠標、麥克風或 發(fā)揮指示設(shè)備功能的顯示器連同鼠標也可以用作輸入設(shè)備112 。0139控制設(shè)備102具有內(nèi)部存儲器存儲控制程序例如OS (操進4亍信息處理。正如圖中所顯示的,控制設(shè)備102主要包括請求解釋 部分102a、瀏覽處理部分102b、鑒定處理部分102c、電子郵件產(chǎn)生部 分102d、網(wǎng)頁產(chǎn)生部分102e、接收部分102f、癌癥狀態(tài)信息指定部分 102g、多變量判別式生成部分102h、判別式值計算部分102i、判別式 值標準評估部分102j、結(jié)果輸出部分102k和發(fā)送部分102m??刂圃O(shè) 備102進行數(shù)據(jù)處理例如移出在從數(shù)據(jù)庫裝置400傳輸?shù)陌┌Y狀態(tài)信 息中以及從客戶端裝置200傳輸?shù)陌被釢舛葦?shù)據(jù)中,包括有缺陷數(shù) 據(jù)或許多無關(guān)數(shù)據(jù)的數(shù)據(jù),以及包括有缺陷數(shù)值的數(shù)據(jù)的解釋變量。0140請求解釋部分102a解釋來自客戶端裝置200或數(shù)據(jù)庫裝 置400的請求,并根據(jù)分析結(jié)果將請求發(fā)送到控制設(shè)備102中的其他 部分。在接收來自客戶端裝置200的用于各種顯示器的瀏覽請求后, 瀏覽處理部分102b產(chǎn)生并將網(wǎng)頁數(shù)據(jù)傳輸?shù)竭@些顯示器。在從客戶端 裝置200或數(shù)據(jù)庫裝置400接收鑒定請求鑒定請求后,鑒定處理部分47102c進行鑒定。電子郵件產(chǎn)生部分102d產(chǎn)生包含各種類型信息的電子 郵件。網(wǎng)頁產(chǎn)生部分102e產(chǎn)生網(wǎng)頁,用于客戶利用客戶端裝置200瀏覽。
0141接收部分102f通過網(wǎng)絡(luò)300接收從客戶端裝置200和數(shù) 據(jù)庫裝置400傳輸?shù)男畔?具體的,氨基酸濃度數(shù)據(jù)、癌癥狀態(tài)信息、 多變量判別式等)。癌癥狀態(tài)信息指定部分102g在生成多變量判別式 中指定目標癌癥狀態(tài)指數(shù)數(shù)據(jù)和氨基酸濃度數(shù)據(jù)。
0142多變量判別式生成部分102h產(chǎn)生多變量判別式,這基于 在接收部分102f接收的癌癥狀態(tài)信息,和在癌癥狀態(tài)信息指定部分 102g中指定的癌癥狀態(tài)信息。具體的,多變量判別式生成部分102h產(chǎn) 生多變量判別式,其通過從多個候選多變量判別式選擇候選多變量判 別式用作多變量判別式,這根據(jù)通過重復(fù)從癌癥狀態(tài)信息在候選多變 量判別式生成部分102hl、候選多變量判別式校驗部分102h2和解釋變 量選擇部分102h3中的處理而積累的校驗結(jié)果。
0143如果之前生成的多變量判別式被存儲在存儲器設(shè)備106 的預(yù)定區(qū)域中,則多變量判別式生成部分102h可以產(chǎn)生多變量判別式, 這通過從存儲器設(shè)備106選擇期望的多變量判別式??商鎿Q的,多變 量判別式生成部分102h可以產(chǎn)生多變量判別式,其通過從在另一個計 算機裝置(例如數(shù)據(jù)庫裝置400 )中存儲的多變量判別式選擇并下載期 望的多變量判別式。
0144后面,將參考圖17描述多變量判別式生成部分102h的 配置。圖17是顯示多變量判別式生成部分102h的配置的方塊圖,其 僅僅大概顯示了配置中與本發(fā)明相關(guān)的部分。另外,多變量判別式生 成部分102h具有候選多變量判別式生成部分102hl,候選多變量判別 式校驗部分102h2和解釋變量選擇部分102h3。候選多變量判別式生成 部分102hl從癌癥狀態(tài)信息產(chǎn)生作為多變量判別式的候選的候選多變 量判別式,這根據(jù)預(yù)定的判別式生成方法。具體地,候選多變量判別 式生成部分102hl可以從癌癥狀態(tài)信息產(chǎn)生多個候選多變量判別式, 其通過使用多種不同的判別式生成方法。候選多變量判別式校驗部分 102h2校驗在候選多變量判別式生成部分102hl中生成的候選多變量判 別式,其根據(jù)特定的校驗方法。具體的,候選多變量判別式校驗部分 102h2可以通過Bootstrap方法、保持評判方法(holdout method)、留
48one out method)等的至少一種對候選多變量判別式的鑒 別率、靈敏度、信息標準的至少 一種進行校驗。解釋變量選擇部分102h3 選擇用于生成候選多變量判別式的癌癥狀態(tài)信息中所包含氨基酸濃度 數(shù)據(jù)的組合,其通過從候選多變量判別式校驗部分102h2中的候選多 變量判別式的解釋變量,這根據(jù)特定的解釋變量選擇方法。解釋變量 選擇部分102h3可以從校驗結(jié)果選擇候選多變量判別式的解釋變量, 這才艮據(jù)逐步方法、最佳^各徑方法(best path method)、局部4僉索方法和 遺傳運算法則的至少 一種。
0145返回到圖6,多變量值計算部分102i計算計算作為多變 量判別式的值的判別式值,這基于在接收部分102f中接受的待評估個 體的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值,以及在多變量判別式生成部分 102h中生成的含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA 中的至少一個作為解釋變量的多變量判別式。
0146多變量判別式可以表達為一個分數(shù)式,或者多個分數(shù)式 的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或 二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至 少一個作為解釋變量。具體的,多變量判別式可以是式1或式2:
aixOrn/ (Trp+Arg)十bp (Cys+Ile) /Leu+c^ (式1 )
a2xGlu/His+b2xSer/Trp+C2xVal/Lys+d2xPro/Arg+e2 (式2 )
其中式1中的a!和l^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的az、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0147多變量判別式可以是Logistic回歸方程、線性判別式、多 重回歸方程、通過支持向量機(Support Vector Machine)所生成的判別 式、通過Mahalanobis廣義距離方法所生成的判別式、通過典型判別式 分析所生成的判別式和通過決策樹所生成的判別式的任意一種。具體 的,多變量判別式可以是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為 解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln 作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。
0148判別式值標準評估部分102j評估待評估個體中的癌癥狀 態(tài),這基于在判別式值計算部分102i中所計算的判別式值。判別式值 標準評估部分102j還包括判別式值標準鑒別部分102jl?,F(xiàn)在參考圖 18描述判別式值標準評估部分102j的配置。圖18是顯示判別式標準 評估部分102j的配置的方塊圖,其僅僅大概顯示了配置中與本發(fā)明相 關(guān)的部分。根據(jù)判別式值,判別式值標準鑒別部分102J1鑒別待評估的 癌癥患者和無癌癥個體。具體的,判別式值標準鑒別部分102J1將判別 式值與預(yù)定的闕值(截止值(cutoff value))進行比較,進而待評估的 癌癥患者和無癌癥個體。
0149返回到圖6,結(jié)果輸出部分102k將控制設(shè)備102中每個 處理部分的處理結(jié)果(判別式值標準評估部分102j中的評估結(jié)果(具 體的,判別式值標準鑒別部分102J1中的鑒別結(jié)果))等輸出到輸出部 分。
0150發(fā)送部分102m將評估結(jié)果發(fā)送到客戶端裝置200,其作 為待評估個體的氨基酸濃度數(shù)據(jù)的發(fā)送器,或者發(fā)送在癌癥評估裝置 100中生成的多變量判別式以及評估結(jié)果發(fā)送到數(shù)據(jù)庫裝置400。
0151后面,參考圖19對本發(fā)明的系統(tǒng)中的客戶端裝置200的 配置進行描述。圖19是顯示本發(fā)明的系統(tǒng)中客戶端裝置200的配置的 實例的方塊圖,其僅僅大概顯示了配置中與本發(fā)明相關(guān)的部分。
0152客戶端裝置200包括通過通信通道相互通信連接的控制 設(shè)備210、 ROM220、 HD(硬盤)230、 RAM240、輸入設(shè)備250、輸出設(shè) 備260、輸入/輸出IF270和通信IF280。
0153控制設(shè)備210具有網(wǎng)頁瀏覽器211、電郵器(electronic mailer) 212、接收部分213和發(fā)送部分214.網(wǎng)頁瀏覽器進行解釋網(wǎng)頁 數(shù)據(jù)的瀏覽處理,并將解釋的網(wǎng)頁數(shù)據(jù)展示在下面描述的顯示器261 行。網(wǎng)頁瀏覽器211可以具有各種嵌入軟件例如流媒體播放器具有接 受、真實和返回流式屏幕圖像的功能。電郵器212發(fā)送并接受電子郵 件,其使用特定的協(xié)議(例如SMTP (簡單郵件傳送協(xié)議)或POP3 (郵 局協(xié)議第三版))。接收部分213接收各種信息,例如從癌癥評估裝置 100通過通信IF280傳輸?shù)脑u估結(jié)果。發(fā)送部分214通過通信IF280將
50各種信息例如關(guān)于待評估個體的氨基酸濃度數(shù)據(jù)發(fā)送到癌癥評估裝置 亂
0154輸入設(shè)備250是例如鍵盤、鼠標、麥克風。下面描述的 顯示器261連同鼠標也可以發(fā)揮指示設(shè)備功能。輸出設(shè)備260是輸出 手段,其通過通信IF280輸出接受的信息,并且包括顯示器(包括家用 電視)261和打印機262.。此外,輸出設(shè)備260可以具有揚聲器等。輸 入/輸出IF270連接到輸入設(shè)備250和輸出設(shè)備260。
0155通信IF280將客戶端裝置200通信連接到網(wǎng)絡(luò)300 (或通 信裝置例如路由器)。換句話說,客戶端裝置200通過通信裝置例如調(diào) 制解調(diào)器(終端適配器)或路由器和電話線或?qū)S镁€路鏈接到網(wǎng)絡(luò)300。 以這種方式,客戶端裝置200可以通過使用特定的協(xié)議進入癌癥評估 裝置100。
0156可以通過根據(jù)需要與外圍設(shè)備如打印機、顯示器和圖像 掃描儀連接的為信息處理裝置(例如信息處理終端例如已知的個人電 腦、工作站、家用電腦、網(wǎng)絡(luò)TV (電視)PHS (個人手機系統(tǒng))終端、 移動手機終端、移動單元通信終端或PDA(個人數(shù)碼助理))安裝用于 網(wǎng)頁數(shù)據(jù)瀏覽功能和電子郵件處理功能的軟件(包括程序、數(shù)據(jù)等) 實現(xiàn)客戶端裝置200。
200中控制設(shè)備210中的全部或部分處理。因此,用于為CPU提供指 令和連同OS(操作系統(tǒng))執(zhí)行各種處理的計算機程序被記錄在ROM220 或HD230中。計算才幾程序(其在被加載在RAM240中時祐j丸行),構(gòu) 成了具有CPU的控制設(shè)備210。計算機程序可以存儲在通過任何網(wǎng)絡(luò) 連接到客戶端裝置200的應(yīng)用程序服務(wù)器中,客戶端裝置200可以根 據(jù)需要下載它們的全部或部分。可以通過硬件例如有線邏輯電路
(wired-logic)實現(xiàn)控制設(shè)備210的處理的全部或任何部分。
0158后面,參考圖4和5描述本發(fā)明的系統(tǒng)中的網(wǎng)絡(luò)300。網(wǎng) 絡(luò)300具有互相連接相互通信連接的癌癥評估裝置100、客戶端裝置 200和數(shù)據(jù)庫裝置400的功能,例如是英特網(wǎng)、內(nèi)聯(lián)網(wǎng)(intranet)或 LAN(局域網(wǎng)(有線/無線))。網(wǎng)絡(luò)300可以是VAN (增值網(wǎng)絡(luò))、個 人電腦通信網(wǎng)絡(luò)、公共電話網(wǎng)絡(luò)(包括模擬和數(shù)字二者)、租用專線通 信網(wǎng)(包括模擬和數(shù)字二者)、CATV(社區(qū)接入電視)網(wǎng)絡(luò)、便攜式交換網(wǎng)絡(luò)或便攜式數(shù)據(jù)包交換網(wǎng)絡(luò)(包括IMT2000 (國際移動通信 2000)系統(tǒng)、GSM (全球移動通信系統(tǒng))系統(tǒng)或PDC (個人數(shù)字手機) /PDC-P系統(tǒng))、無線呼叫網(wǎng)絡(luò)、局域無線網(wǎng)絡(luò)例如藍牙(注冊商標)、 PHS網(wǎng)絡(luò)、衛(wèi)星通信網(wǎng)絡(luò)(包括CS (通信衛(wèi)星)、BS (廣播衛(wèi)星)和 ISDB (集成服務(wù)數(shù)字廣播))等。
0159后面,參考圖20描述本發(fā)明的系統(tǒng)中數(shù)據(jù)庫400的配置。 圖20是顯示本發(fā)明的系統(tǒng)中數(shù)據(jù)庫裝置400的配置的實例的方塊圖, 其僅僅大概顯示了配置中與本發(fā)明相關(guān)的部分。
0160數(shù)據(jù)庫裝置400具有存儲功能,例如,用于生成癌癥評 估裝置100或數(shù)據(jù)庫裝置400中的多變量判別式的癌癥狀態(tài)信息,在 在癌癥評估裝置中生成的多變量判別式和癌癥評估裝置100中的評估 結(jié)果。正如圖20中所顯示的,數(shù)據(jù)庫裝置400包括控制設(shè)備402例如 CPU,其集成地控制整個數(shù)據(jù)庫裝置400;通信界面404,其通過通信 裝置例如路由器并通過有限或無線通信電路例如專用線路將數(shù)據(jù)庫裝 置連接到網(wǎng)絡(luò)300;存儲器設(shè)備406,其存儲各種數(shù)據(jù)、表和檔案(例 如網(wǎng)頁的檔案);和輸入/輸出界面408,其連接到輸入i殳備412和輸出 設(shè)備414,這些部分通過任意通信通道相互連接。
0161存儲器設(shè)備406是存儲手段,并可以是例如存儲器裝置 例如RAM或ROM、硬盤驅(qū)動器例如硬盤、軟盤、光盤等。在各種處 理中使用的各種程序被存儲在存儲器設(shè)備406中。通信界面404允許 數(shù)據(jù)庫裝置400和網(wǎng)絡(luò)300 (或通信裝置例如路由器)之間的通信。因 此,通信界面404具有與其他終端通過通信線路通信數(shù)據(jù)的功能。輸 入/輸出界面408鏈接到輸入設(shè)備412和輸出設(shè)備414。顯示器(包括 家用電視)、揚聲器或打印機可以作為輸出設(shè)備414 (后面,輸出設(shè)備 414可以被描述為顯示器414)。鼠標、麥克風或發(fā)揮指示設(shè)備功能的 顯示器連同鼠標也可以用作輸入設(shè)備412。
0162控制設(shè)備402具有內(nèi)部存儲器存儲控制程序例如OS (操 作系統(tǒng))、用于各種處理程序的程序和其他需要的數(shù)據(jù),并且根據(jù)這些 程序進行各種信息處理。正如在圖中顯示的,控制設(shè)備402主要包括 請求解釋部分402a、瀏覽處理部分402b、鑒定處理部分402c、電子郵 件產(chǎn)生部分402d、網(wǎng)頁產(chǎn)生部分402e和發(fā)送部分402f。
0163請求解釋部分402a解釋來自癌癥評估裝置100的請求,
52并根據(jù)分析結(jié)果將請求發(fā)送到控制設(shè)備402的其他部分。在從癌癥評 估裝置IOO接收到各種屏幕瀏覽請求后,瀏覽處理部分402b產(chǎn)生并傳 輸用于這些屏幕的網(wǎng)頁數(shù)據(jù)。在從癌癥評估裝置100接收鑒定請求之 后,鑒定處理部分402c進行鑒定。電子郵件產(chǎn)生部分402d產(chǎn)生電子 郵件,其包含各種信息。網(wǎng)頁產(chǎn)生部分402e為用戶產(chǎn)生網(wǎng)頁以利用客 戶端裝置200進行瀏覽。發(fā)送部分402f為癌癥評估裝置IOO發(fā)送信息 例如癌癥狀態(tài)信息和多變量判別式。
01642-3.在本發(fā)明的系統(tǒng)中的處理
這里,參考圖21對如上構(gòu)成的本發(fā)明的系統(tǒng)中進行的癌癥評估服 務(wù)處理方法的實例進行描述。圖21是顯示在本發(fā)明的系統(tǒng)中進行的癌 癥評估服務(wù)處理的實例的流程圖。
0165在本發(fā)明處理中所使用的氨基酸濃度數(shù)據(jù)涉及通過分析 之前從個體收集的血液而獲得的氨基酸濃度值。后面,將簡要描述分 析血液氨基酸的方法。首先,在肝素處理的試管中收集血液樣品,接 著通過對試管進行離心而分離血漿。將所分離的所有血漿樣品冷凍, 在測量氨基酸濃度之前儲存在-70。C。在測量氨基酸濃度之前,通過加 入硫代水楊酸達到濃度3 %而對血漿樣品進行除去蛋白質(zhì)。使用通過在 后柱中使用茚三酮反應(yīng)的高效液相色譜(HPLC)的氨基酸分析儀用于 測量氨基酸濃度。
0166首先,當用戶指定從癌癥評估裝置IOO提供的網(wǎng)站地址 (例如URL)時,客戶端裝置200通過顯示網(wǎng)頁瀏覽器211的屏幕上 的輸入設(shè)備250進入癌癥評估裝置100。具體的,當用戶指示更新客戶 端裝置200上的網(wǎng)頁瀏覽器211屏幕更新時,網(wǎng)頁瀏覽器211通過特 定的鞋業(yè)發(fā)送從癌癥評估裝置IOO提供的網(wǎng)站地址,進而將求求傳輸 對應(yīng)氨基酸濃度數(shù)據(jù)傳輸屏幕的網(wǎng)頁的請求傳輸?shù)桨┌Y評估裝置100, 這基于地址的路由。
0167接著,在從客戶端裝置200接收請求之后,癌癥評估裝 置100中的請求解釋部分102a分析所傳輸?shù)恼埱?,并根?jù)分析結(jié)果將 請求發(fā)送到控制設(shè)備102中的其他部分。具體的,當傳輸?shù)恼埱笫前l(fā) 送對應(yīng)氨基酸濃度數(shù)據(jù)傳輸屏幕的網(wǎng)頁時,癌癥評估裝置100中的瀏 覽處理部分102b獲得了網(wǎng)頁數(shù)據(jù)用于展示在存儲器設(shè)備06中預(yù)定區(qū) 域存儲的網(wǎng)頁,并將所獲得的網(wǎng)頁數(shù)據(jù)發(fā)送到客戶端裝置200。更具體的,在接收對應(yīng)用戶氨基酸濃度數(shù)據(jù)傳輸屏幕的網(wǎng)頁傳輸請求后,癌
癥評估裝置100中的控制設(shè)備102要求用戶輸入用戶ID和用戶密碼。 如果輸入用戶ID和密碼,則癌癥評估裝置100中的鑒定處理部分102c 檢驗輸入的用戶ID和密碼,其通過將他們與在用戶信息檔案106a中 存儲的用戶ID和密碼進行比較用于鑒定。只有當用戶通過鑒定時,癌 癥評估裝置100中的瀏覽處理部分102b才為客戶端裝置200發(fā)送網(wǎng)頁 信息用于展示對應(yīng)氨基酸濃度數(shù)據(jù)傳輸屏幕的網(wǎng)頁。利用從客戶端200 連同傳輸請求發(fā)送的IP (英特網(wǎng)協(xié)議)對客戶端裝置200進行鑒定。
0168接著,客戶端裝置200在接收部分213接收從癌癥評估 裝置100傳輸?shù)木W(wǎng)頁數(shù)據(jù)(用于展示對應(yīng)氨基酸濃度數(shù)據(jù)傳輸屏幕的 網(wǎng)頁),利用網(wǎng)頁瀏覽器211解釋所接受網(wǎng)頁數(shù)據(jù),并在顯示器261上 展示氨基酸濃度數(shù)據(jù)傳輸屏幕。
0169當用戶通過輸入設(shè)備250輸入和選擇時,例如在顯示器 261上展示的氨基酸濃度數(shù)據(jù)傳輸屏幕上的個體的氨基酸濃度數(shù)據(jù),客 戶端裝置200的發(fā)送部分241為癌癥評估裝置100發(fā)送識別信號 (identifier)用于鑒定所輸入的信息和所選擇的項目,進而將作為待評 估個體的氨基酸濃度數(shù)據(jù)傳輸?shù)桨┌Y評估裝置100 (步驟SA-21)。在 步驟SA-21中,氨基酸濃度數(shù)據(jù)的傳輸可以例如通過使用現(xiàn)有的檔案 傳輸技術(shù)例如FTP (檔案轉(zhuǎn)移協(xié)議)來實現(xiàn)。
0170接著,癌癥評估裝置100的請求解釋部分102a解釋從客 戶端裝置200傳輸?shù)淖R別信號,進而分析來自客戶端裝置200傳輸?shù)?請求,并請求數(shù)據(jù)庫裝置400發(fā)送多變量判別式用戶癌癥評估(具體 的,用于鑒別2組癌癥和非癌癥)。
0171接著,數(shù)據(jù)庫裝置400的請求解釋部分402a解釋來自癌 癥評估裝置100的傳輸請求,并為癌癥評估裝置100傳輸存儲在存儲 器設(shè)備106的預(yù)定區(qū)域的多變量判別式(例如,更新的最新多變量判 別式),其含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中 的至少一個的濃度作為解釋變量。
0172在步驟SA-22中,傳輸?shù)桨┌Y評估裝置100的多變量判 別式可以表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多 變量判別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。具體的,傳輸?shù)桨┌Y評估裝置100的多變量判別式可以是式1或式2:
a工xOrn/ (Trp+Arg) +一 (Cys+Ile) /Leu+d (式1 )
a2xGlu/His+b2xSer/Trp+C2xVal/;Lys+d2xPro/Arg+e2 (式2 )
其中式1中的a,和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
0173在步驟SA-22中,傳輸?shù)桨┌Y評估裝置100的多變量判 別式可以是Logistic回歸方程、線性判別式、多重回歸方程、通過支持 向量才幾(Support Vector Machine)所生成的判別式、通過Mahalanobis廣 義距離方法所生成的判別式、通過典型判別式分析所生成的判別式和 通過決策樹所生成的判別式的任意一種。具體的,傳輸?shù)桨┌Y評估裝 置100的多變量判別式可以是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit 作為解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp 和Gln作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His 和Lys作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。
0174在接收部分102f中,癌癥評估裝置11接受從客戶端裝置 200傳輸?shù)膫€體的氨基酸濃度數(shù)據(jù)以及從數(shù)據(jù)庫裝置400傳輸?shù)亩嘧兞?判別式,并將接收的氨基酸濃度數(shù)據(jù)儲存在氨基酸濃度數(shù)據(jù)檔案106b 的預(yù)定存儲器區(qū)域中,并將接收的多變量判別式存儲在多變量判別式 檔案106e4的預(yù)定存儲器區(qū)域中(步驟SA-23)。
0175在癌癥評估裝置100的控制設(shè)備102中,數(shù)據(jù)例如有缺 陷的數(shù)據(jù)和五官的數(shù)據(jù)接著被從步驟SA-23接受的個體的氨基酸濃度 數(shù)據(jù)中移出(步驟SA-24)。
0176接著,癌癥評估裝置100在判別式值計算部分102i中計 算判別式值,這基于在步驟SA-23接收的多變量判別式,以及已經(jīng)在 步驟SA-24移出有缺陷的數(shù)據(jù)和五官數(shù)據(jù)的氨基酸濃度數(shù)據(jù)(步驟 SA-25 )。
0177接著,癌癥評估裝置100的判別式值標準鑒別部分102jl 將在步驟SA-25中計算的判別式值與之前建立的闕值(截止值(cutoff
55value))進行比較,這樣鑒別個體中的癌癥和非癌癥;并將鑒別結(jié)果存 儲在評估結(jié)果檔案106g的預(yù)定存儲器區(qū)域中(步驟SA-26)。
0178接著,癌癥評估裝置100的發(fā)送部分102m將步驟SA-26 中獲得的鑒別結(jié)果(關(guān)于鑒別癌癥和非癌癥的鑒別結(jié)果)發(fā)送到客戶 端裝置200 (其已經(jīng)發(fā)送了氨基酸濃度數(shù)據(jù))和發(fā)送到數(shù)據(jù)庫裝置400 (步驟SA-27)。具體的,癌癥評估裝置100首先產(chǎn)生網(wǎng)頁用于在網(wǎng)頁 產(chǎn)生部分102e中展示鑒別結(jié)果,并在存儲器設(shè)備106的預(yù)定存儲器區(qū) 域中存儲對應(yīng)所產(chǎn)生網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。接著,如上對用戶進行鑒定, 其通過經(jīng)輸入設(shè)備250輸入預(yù)定的URL (統(tǒng)一資源定位符)到客戶端 裝置200的網(wǎng)頁瀏覽器中;客戶端裝置200將網(wǎng)頁瀏覽請求發(fā)送到癌 癥評估裝置100。接著,癌癥評估裝置100在瀏覽處理部分102b中檢 驗從客戶端裝置200傳輸?shù)臑g覽請求,并從存儲器設(shè)備106的預(yù)定存 儲器區(qū)域讀取對應(yīng)網(wǎng)頁的網(wǎng)頁數(shù)據(jù)用于展示鑒別結(jié)果。接著,癌癥評 估裝置100的發(fā)送部分102m將讀出的網(wǎng)頁數(shù)據(jù)發(fā)送到客戶端裝置200, 并同時將網(wǎng)頁數(shù)據(jù)或鑒別結(jié)果發(fā)送到數(shù)據(jù)庫裝置400。
0179在步驟SA-27中,癌癥評估裝置100的控制設(shè)備102可 以將鑒別結(jié)果通過電子郵件通知用戶客戶端裝置200。具體的,首先癌 癥評估裝置IOO在傳輸時機在電子郵件產(chǎn)生部分102d中獲取電子郵件 地址,例如基于用戶ID,參考在用戶信息檔案106a中存儲的用戶信息。 接著,癌癥評估裝置IOO產(chǎn)生電子郵件數(shù)據(jù)包括用戶姓名和鑒別結(jié)果,
地址。接著,癌癥評估裝置100的發(fā)送部分102m將所產(chǎn)生的數(shù)據(jù)發(fā)送 到客戶端裝置200。
0180同樣在步驟SA-27,癌癥評估裝置IOO可以將鑒別結(jié)果發(fā) 送到用戶客戶端裝置200,其通過使用現(xiàn)有的檔案轉(zhuǎn)移技術(shù)例如FTP。
0181返回到圖21,數(shù)據(jù)庫裝置400中的控制設(shè)備402接收從 癌癥評估裝置100傳輸?shù)蔫b別結(jié)果或者網(wǎng)頁數(shù)據(jù),并將接收的鑒別結(jié) 果或網(wǎng)頁數(shù)據(jù)存儲(積累)在存儲器設(shè)備406的預(yù)定存儲器區(qū)域中(步 驟SA-28)。
0182客戶端裝置的接收部分213接收從癌癥評估裝置100傳 輸?shù)木W(wǎng)頁數(shù)據(jù),使用網(wǎng)頁瀏覽器211解釋所接收的網(wǎng)頁數(shù)據(jù),以在顯 示器261上展示網(wǎng)頁屏幕,其顯示個體的鑒別結(jié)果(步驟SA-29)。當通過電子郵件從癌癥評估裝置100發(fā)送鑒別結(jié)果時,在任何時機接收
從癌癥評估裝置100傳輸?shù)碾娮余]件,并利用客戶端裝置200的電子 郵件器212的已知功能將所接收的電子郵件展示在顯示器261上。
0183以這種方式,用戶知道關(guān)于鑒別個體中2組癌癥和非癌 癥的鑒別結(jié)果,其通過瀏覽在顯示器261上展示的網(wǎng)頁。用戶可以通 過打印機262打印在顯示器261上所展示的網(wǎng)頁內(nèi)容。
0184如果通過電子郵件從癌癥評估裝置100傳輸鑒別結(jié)果, 則用戶讀取在顯示器261上展示的電子郵件,進而用戶能夠確認關(guān)于 鑒別個體中2組癌癥和非癌癥的鑒別結(jié)果。用戶可以通過打印才幾262 打印在顯示器261上所展示的網(wǎng)頁內(nèi)容。
0185根據(jù)前面的描述,完成了對癌癥評估服務(wù)的解釋。
01862-4.第二實施方式和其他實施方式的概述 根據(jù)上面詳細描述的癌癥評估裝置,客戶端裝置200將個體的氨 基酸濃度數(shù)據(jù)發(fā)送到癌癥評估裝置,在從癌癥評估裝置接收請求之后, 數(shù)據(jù)庫裝置400將用于判別2組癌癥和非癌癥的多變量判別式傳輸?shù)?癌癥評估裝置IOO.通過癌癥評估裝置100,從客戶端裝置200接收氨基 酸濃度數(shù)據(jù),并同時從數(shù)據(jù)庫裝置400接收多變量判別式,基于所接
收的氨基酸濃度數(shù)據(jù)和所接收的多變量判別式計算判別式值,并將所 計算的判別式值與之前建立的闕值比較,進而鑒別個體中的癌癥和非
癌癥,將該結(jié)果傳輸?shù)娇蛻舳搜b置200和數(shù)據(jù)庫裝置400.接著,客戶 端裝置200接收并展示從癌癥評估裝置100傳輸?shù)蔫b別結(jié)果,數(shù)據(jù)庫 裝置400接收并存儲從癌癥評估裝置IOO傳輸?shù)蔫b別結(jié)果。因此,可 以用于鑒別2組癌癥和非癌癥的多變量判別式中所獲得的判別式值可 以用于達到實現(xiàn)精確鑒別2組癌癥和非癌癥的效果。
0187根據(jù)癌癥評估系統(tǒng),多變量判別式可以表達為一個分數(shù) 式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分 子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。具體的,多變量判別式可以 是式1或式2:
a工xOrn/ (Trp+Arg)十b, (Cys+Ile) /Leu+ci (式1 )
57a2xGlu/His+b2xSer/Trp+c2xVal/Lys+d2xPro/Arg+e2 (式2)
其中式1中的ai和bi是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。??梢?通過在國際申請WO 2006/098192中所描述的方法(在后面所描述的第 二實施方式中所描述的多變量判別式生成處理)生成上述的多變量判 別式,其中,國際申請WO 2006/098192是由本發(fā)明的申請人提交的國 際申請。優(yōu)選使用通過這些方法獲得的所有多變量判別式用于評估癌 癥狀態(tài),而與在作為輸入數(shù)據(jù)的氨基酸濃度數(shù)據(jù)中氨基酸濃度的單位 無關(guān)。
0188根據(jù)癌癥評估系統(tǒng),多變量判別式可以是Logistic回歸方 程、線性判別式、多重回歸方程、通過支持向量機(Support Vector Machine)所生成的判別式、通過Mahalanobis廣義距離方法所生成的判 別式、通過典型判別式分析所生成的判別式和通過決策樹所生成的判 別式的任意一種。具體的,多變量判別式可以是利用Orn、 Cys、 Tau、 Trp、 Gln、和Cit作為解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸方程,或者利用 Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。因此, 在特別地可以用于鑒別2組癌癥和非癌癥的多變量判別式中獲得的判 別式值可以用于達到實現(xiàn)更精確鑒別2組癌癥和非癌癥的效果。可以 通過在國際申請WO 2006/098192中所描述的方法(在后面所描述的第 二實施方式中所描述的多變量判別式生成處理)生成上述的多變量判 別式,其中,國際申請WO 2006/098192是由本發(fā)明的申請人提交的國 際申請。
0189除了上面描述的笫二實施方式外,在權(quán)利要求的技術(shù)范 圍內(nèi),還可以以各種不同的實施方式本發(fā)明的癌癥評估系統(tǒng)、癌癥評 估程序產(chǎn)品和記錄介質(zhì)。例如,在上述第二實施方式中所描述的處理 中,上述作為自動進行的處理的全部或一部分可以人工進行,人工進 行的處理的全部或一部分可以通過已知的方法自動進4亍。另外,上面
58的說明書或附圖中顯示的處理程序、控制程序、具體的姓名、各種注
冊信息、包括如提取條件(retrieval condition )的參數(shù)、屏幕和數(shù)據(jù)庫 配置可以被任意修改,除非有特別說明。例如,圖中所顯示的癌癥評 估裝置100的組建是大概的和功能性的,而可以與圖中所顯示的實體 上不相同的。此外,癌癥評估裝置100中每個組件和每個設(shè)備的操作 功能的全部或一部分(特別的,在控制設(shè)備102中的處理)可以由CPU (中央處理器)或CPU執(zhí)行的程序執(zhí)行,并可以由有線邏輯電路 (wired-logic )實現(xiàn)。
0190"程序"是以任意語言書寫的或由任意描述方法書寫的數(shù)據(jù) 處理方法,并可以是任意格式的,例如源代碼或二進制碼。"程序"可以 不僅僅是配置的那樣,還可以連同許多才莫塊和文庫(library)或聯(lián)通不 同的程序例如OS (操作程序)運行以達到其功能。程序被儲存在記錄 介質(zhì)上,并根據(jù)需要由癌癥評估裝置100機械讀取。任何公知的配置 或程序都可以用于讀取記錄在每個裝置中記錄介質(zhì)上的程序,并用于 讀取程序以及讀取后程序的安裝。
0191"記錄介質(zhì)"包括任何"可移動物理介質(zhì)"、"固定的物理介 質(zhì),,和"通信介質(zhì)"。"可移動物理介質(zhì),,的例子包括軟盤、磁性光盤、 ROM、 EPROM (可擦除可編程只讀存儲器)、EEPROM (電可擦寫可 編程只讀存儲器)、CD-ROM (致密光碟只讀存儲器)、MO(磁-光盤)、 DVD (多功能數(shù)碼光盤)等。"固定物理介質(zhì)"的例子包括各種安裝在 計算機系統(tǒng)中的介質(zhì),例如ROM、 RAM和HD。例如當程序通過網(wǎng)絡(luò) 例如LAN (局域網(wǎng))、WAN (廣域網(wǎng))或英特網(wǎng)傳輸時,"通信介質(zhì)" 短時間存#"程序,例如通信線路和載波。
0192最后,參考圖21詳細描述癌癥評估裝置100中進行的多 變量判別式處理的例子。圖22是顯示多變量判別式生成處理的實例的 流程圖。多變量判別式生成處理可以在處理癌癥狀態(tài)信息的數(shù)據(jù)庫裝 置400中運行。
0193在本文中,癌癥評估裝置100將之前從數(shù)據(jù)庫裝置400 獲得癌癥狀態(tài)信息存儲在癌癥狀態(tài)信息檔案106c的預(yù)定存儲器區(qū)域 中。癌癥評估裝置100需要在指定的癌癥狀態(tài)信息檔案106c的預(yù)定存 儲器區(qū)域中存儲之前在癌癥狀態(tài)信息指定部分102g中指定的癌癥狀態(tài) 信息包括癌癥狀態(tài)指數(shù)數(shù)據(jù)和氨基酸濃度數(shù)據(jù)。0194根據(jù)預(yù)定的判別式生成方法,多變量判別式生成部分102h 中的候選多變量判別式生成部分102hl從存儲在指定的癌癥狀態(tài)信息 檔案106d的預(yù)定存儲器區(qū)域中存儲的癌癥狀態(tài)信息生成候選多變量判 別式,并將生成的候選多變量判別式存儲在候選多變量判別式檔案 106el的預(yù)定存儲器區(qū)域中(步驟SB-21)。具體的,首先,多變量判 別式生成部分102h中的候選多變量判別式生成部分102hl從許多不同 的判別式生成方法(包括多變量分析方法例如主成分分析、判別式分 析、支持向量機、多重回歸分析、Logistic回歸分析、K-均值法、聚類 分析(Cluster Analysis)和決定樹等)選出期望的方法,并基于所選擇的 判別式生成方法確定需要生成的候選多變量判別式的形式。接著,多 變量判別式生成部分102h中的候選多變量判別式生成部分102hl基于 癌癥狀態(tài)信息進行各種對應(yīng)所選擇的函數(shù)選擇方法的計算(例如平均 值或偏差)。接著,多變量判別式生成部分102h中的候選多變量判別 式生成部分102hl確定用于計算結(jié)果和所確定候選多變量判別式的參 數(shù)。以這種方式,產(chǎn)生候選多變量判別式,其基于所選擇的判別式生 成方法。如果同時和并行地(平行的)通過使用多種組合的不同判別 式生成方法產(chǎn)生候選多變量判別式,則可以平行地對每種所選擇的判 別式生成方法進行上述處理??商鎿Q的,例如,如果連續(xù)地通過組合 多種不同的判別式生成方法產(chǎn)生候選多變量判別式,則通過用通過進 行主成分分生成的候選多變量判別式轉(zhuǎn)化癌癥狀態(tài)信息可以產(chǎn)生候選 多變量判別式,并對轉(zhuǎn)化的癌癥狀態(tài)信息進行判別式分析。
0195多變量判別式生成部分102h2中的候選多變量判別式校 驗部分102h2校驗(相互校驗)在步驟SB-21中生成的候選多變量判 別式,其根據(jù)特定的校驗方法,并將校驗結(jié)果存儲在校驗結(jié)果檔案 106e2中的預(yù)定存儲器區(qū)域中(步驟SB-22)。具體的,首先,多變量 判別式生成部分102h2中的候選多變量判別式校驗部分102h2產(chǎn)生用 于校驗候選多變量判別式的校驗數(shù)據(jù),這基于存儲在指定的癌癥狀態(tài) 信息檔案106d的預(yù)定存儲器區(qū)域中,并根據(jù)所產(chǎn)生的校驗數(shù)據(jù)校驗候 選多變量判別式。如果在步驟SB-21通過使用多種不同的判別式生成 方法產(chǎn)生多種候選多變量判別式,則在多變量判別式生成部分102h2 中的候選多變量判別式校驗部分102h2中校驗對應(yīng)每種判別式生成方 法的每個候選多變量判別式,其根據(jù)特定的校驗方法。本文中,在步驟SB-22中,通過Bootstrap方法、保持評判方法(holdout method )、 留一方法(leave one out method)等的至少一種對候選多變量判別式的 鑒別率、靈敏度、信息標準的至少一種進行校驗。因此,可以選擇一 種可預(yù)測性和可靠性更高的候選多變量判別式,其基于癌癥狀態(tài)信息 和診斷條件。
0196接著,多變量判別式生成部分102h2中的解釋變量選擇 部分102h3選擇用于生成候選多變量判別式的癌癥狀態(tài)信息中所包含 的氨基酸濃度數(shù)據(jù)的組合,其通過根據(jù)特定的解釋變量選擇方法從步 驟SB-22中的校驗結(jié)果選擇候選多變量判別式的解釋變量,并將癌癥 狀態(tài)信息包括選擇的氨基酸濃度數(shù)據(jù)的組合存儲在所選擇癌癥狀態(tài)信 息檔案106e3的預(yù)定存儲器區(qū)域中(步驟SB-23)。當在步驟SB-21中 通過使用多種不同的判別式生成方法產(chǎn)生多種候選多變量判別式時,
每一^候選多變量判別式;多變量歲'j別式生成部一分102h ^的解釋變量 選擇部分102h選擇對應(yīng)步驟SB-22中獲得的嬌艷結(jié)果的每種候選多變 量判別式的候選多變量判別式的解釋變量,其根據(jù)在步驟SB-23中的 特定解釋變量選擇方法。這里,在步驟SB-23中,可以根據(jù)逐步方法、 最佳^^徑方法(best path method )、局部4全索方法和遺傳運算法則的至 少 一種從校驗結(jié)果選擇候選多變量判別式的解釋變量。最佳路徑方法 是一種通過優(yōu)化候選多變量判別式的評估指數(shù),同時逐個消除候選多 變量判別式中所包含的解釋變量的方法。在步驟SB-23中,多變量判 別式生成部分102h中的解釋變量選擇部分102h3可以選擇氨基酸濃度 數(shù)據(jù)的組合,這基于存儲在指定癌癥狀態(tài)信息檔案106d的預(yù)定存儲器 區(qū)域中的癌癥狀態(tài)信息。
0197接著,多變量判別式生成部分102h判斷是否處理了在指 定癌癥狀態(tài)信息檔案106d的預(yù)定存儲器區(qū)域中存儲的癌癥狀態(tài)信息中 所包含的氨基酸濃度數(shù)據(jù)的全部組合,如果判斷結(jié)果是"結(jié)束"(步驟 SB-24中的"是"),則處理進入下一步驟(SB-25 ),如果判斷結(jié)果不是"結(jié) 束"(步驟SB-24中的"否,,),則返回到步驟SB-21。多變量判別式生成 部分102h可以判斷是否在步驟SB-23中選擇的氨基酸濃度數(shù)據(jù)的組合 與在指定癌癥狀態(tài)信息檔案106d的預(yù)定存儲器區(qū)域中存儲的癌癥狀態(tài) 信息中包含的氨基酸濃度的組合相同,如果判斷結(jié)果是"相同"(步驟
61SB-24中的"是"),則處理進入下一步驟(SB-25 ),如果判斷結(jié)果不是"相 同,,(步驟SB-24中的"否,,),則可以返回到步驟SB-21。具體的,如果 校驗結(jié)果是每個多變量判別式的校驗值,則多變量判別式生成部分 102h可以進入步驟SB-25,或者返回到步驟SB-21,這基于將評估數(shù)值 與對應(yīng)每種判別式生成方法的特定闕值進行比較。
0198接著,多變量判別式生成部分102h基于校驗結(jié)果確定多 變量判別式,這通過從候選多變量判別式中選擇用作多變量判別式的 候選多變量判別式,并將確定的多變量判別式(選擇的候選多變量判 別式)存儲在多變量判別式檔案106e4的特定存儲器區(qū)域中(步驟 SB-25)。這里,在步驟SB-25中,例如,可以從通過相同判別式生成 方法生成的候選多變量判別式,或者從所有候選多變量判別式中選擇 最佳多變量判別式。
0199這些是多變量判別式生成處理的描述。
實施例0200將一組確定i貪斷為癌癥的癌癥患者的血液樣品和一組非 癌癥患者的血液樣品通過氨基酸分析方法進行血液中氨基酸濃度的測 量。氨基酸濃度的單位是nmol/ml。圖23是顯示非癌癥和癌癥之間氨 基酸解釋變量分布的箱線圖(boxplot)。在圖23中,水平軸表示非癌 癥組(對照)和癌癥組,圖中的ABA和Cys分別表示a-ABA ( a-氨基 丁酸)和半胱氨酸。為了鑒別癌癥組和非癌癥組的目的,在2組之間 進行t-檢驗。
0201在癌癥組中,與非癌癥組相比,Tau、 Glu、 Pro、 ABA、 Cys、 Phe、 Orn和Lys顯著升高(顯著差異的概率,P<0.05 ), Gln、 His、 Trp和Arg顯著降低。因此,清楚的是,氨基酸解釋變量Tau、 Glu、、 Pro、 ABA、 Cys、 Phe、 Orn、 Lys、 Gln、 His、 Trp和Arg具有鑒別2 組癌癥組和非癌癥組的能力。
0202此外,進行使用在ROC (接受者操作特征)曲線(圖24) 的曲線下面積(AUC)的評估用于鑒別2組癌癥組和非癌癥組,這基 于各自的氨基酸解釋變量,AUC顯示氨基酸解釋變量Tau、 Glu、 Gln、 Cys、 Trp、 Lys和Arg的數(shù)值大于0.6。因此,清楚的是,氨基酸解釋 變量Tau、 Glu、 Gln、 Cys、 Trp、 Lys和Arg具有鑒別2組癌癥組和非
62癌癥組的能力。 實施例0203使用在實施例1中所使用的樣品數(shù)據(jù)。使用由本發(fā)明的 申請人:提交的國際公開No. 2004/052191中所描述的方法,期望檢索鑒 別2組癌癥組和非癌癥組關(guān)于癌癥鑒別的性能最大化的指數(shù),并從多 種具有等同性能的指數(shù)中獲得指數(shù)式1。
指凄丈式1: (Orn)/(Trp+Arg) + (Cys+Ile)/(Leu)
0204對基于指數(shù)式1的癌癥診斷性能進行評估,其基于ROC 曲線(圖25 )的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得 了 0.925±0.014的AUC (95%置信區(qū)間0.897-0.953 )。如果々i定癌癥 組的癥狀發(fā)病率為0.011,截止值為1.41,通過確定指數(shù)式1鑒別2組 癌癥組和非癌癥組的最佳截止值時,所獲得的靈敏度為82%,特異性 為89%,陽性預(yù)測值為48%,陰性預(yù)測值為98%,正確診斷率為88%。 因此,發(fā)現(xiàn)指數(shù)式1是具有高診斷性能的可以使用的指數(shù)。除此之外, 獲得了多種分數(shù)式,其具有與指數(shù)式1具有等同鑒別性能。這些分數(shù) 式表示在圖26、 27、 28和29中。
實施例0205使用在實施例1中所使用的樣品數(shù)據(jù)。通過Logistic分析
(基于BIC (貝葉斯定理信息標準)最小標準的解釋變量覆蓋方法)檢
索關(guān)于癌癥鑒別2組癌癥和非癌癥性能最大化的指數(shù),并獲得作為指
數(shù)式2的Logistic回歸方程,其由Orn、 Cys、 Tau、 Trp、 Gln和Cit構(gòu)
成(氨基酸解釋變量Orn、 Cys、 Tau、 Trp、 Gln和Cit的數(shù)字系數(shù)以及
常 數(shù) 在 相 同 數(shù) 量 級 上 分 別 是 0.144±0.014, 0.085±0.021, 0.051±0.011, —0 161±0'021, —
0.016±0.003, -0.084±0.024,牙口 0.967±1.613,)。
0206對基于指數(shù)式2的癌癥診斷性能進行評估,其基于ROC
曲線(圖30)的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得
了 0.946±0.011的AUC ( 95%置信區(qū)間0.925 - 0.968 )。因此,發(fā)現(xiàn)指
63數(shù)式2是具有高診斷性能的可以使用的指數(shù)。如果假定癌癥組的癥狀
發(fā)病率為0.011,截止值為0.123,通過確定指數(shù)式2鑒別2組癌癥組 和非癌癥組的最佳截止值時,所獲得的靈敏度為88%,特異性為88%, 陽性預(yù)測值為51%,陰性預(yù)測值為98%,正確診斷率為88%。因此, 發(fā)現(xiàn)指數(shù)式2是具有高診斷性能的可以使用的指數(shù)。除此之外,獲得 了多種分數(shù)式,其具有與指數(shù)式1具有等同鑒別性能。這些分數(shù)式表 示在圖31、 32、 33和34中。圖31、 32、 33和34中所呈現(xiàn)的方程的 系數(shù)和其95%置信區(qū)間的各自數(shù)值可以是乘以實數(shù)的數(shù)值,并且其常 數(shù)和95%置信區(qū)間的數(shù)值可以是通過加、減、乘或除以任意實數(shù)獲得 的數(shù)值。
實施例0207使用在實施例1中所使用的樣品數(shù)據(jù)。通過線性判別式 分析(解釋變量覆蓋方法)檢索關(guān)于癌癥鑒別2組癌癥和非癌癥性能 最大化的指數(shù),并獲得作為指數(shù)式3的線性判別式,其由解釋變量Orn、 Cys、 Arg、 Tau、 Trp和Gln構(gòu)成(氨基酸解釋變量Orn、 Cys、 Arg、 Tau 、 Trp和 Gln的數(shù)字系數(shù)在相同數(shù)量級上分別是 10.683±1.134, 6.461±2.416, -2.416±1.028, 4.872±1.324, —8-048±1.887,禾口 一1±0 259,)。
0208對基于指數(shù)式3的癌癥診斷性能進行評估,其基于ROC 曲線(圖35)的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得 了 0.938士0.012的AUC (95%置信區(qū)間0.915 ~ 0.962 )。因此,發(fā)現(xiàn)指 數(shù)式3是具有高診斷性能的可以使用的指數(shù)。如果假定癌癥組的癥狀 發(fā)病率為0.011,截止值為140.1,通過確定指數(shù)式3鑒別2組癌癥組 和非癌癥組的最佳截止值時,所獲得的靈敏度為86%,特異性為88%, 陽性預(yù)測值為51%,陰性預(yù)測值為98%,正確診斷率為88%。因此, 發(fā)現(xiàn)指數(shù)式3是具有高診斷性能的可以使用的指數(shù)。除此之外,獲得 了多種線性判別式,其具有與指數(shù)式3具有等同鑒別性能。這些線性 判別式表示在圖36、 37、 38和39中。圖36、 37、 38和39中所呈現(xiàn) 的方程的系數(shù)和其95%置信區(qū)間的各自數(shù)值可以是乘以實數(shù)的數(shù)值, 并且其常數(shù)和95%置信區(qū)間的數(shù)值可以是通過加、減、乘或除以任意 實數(shù)獲得的數(shù)值。
64實施例0209使用在實施例1中所使用的樣品數(shù)據(jù)。通過解釋變量覆 蓋方法提取所有用于進行鑒別關(guān)于癌癥的2組癌癥組和非癌癥組的線 性判別式。假定在每個判別式中出現(xiàn)的氨基酸解釋變量的最大值是6, 計算滿足該條件的每個判別式的ROC曲線下的面積。這里,測量ROC 曲線下的面積等于或大于某個闕值的判別式中出現(xiàn)的每種氨基酸的頻 率,結(jié)果是,當分別采用ROC曲線下的面積分別為0.75、 0.8、 0.85 和0.9作為闕值時,在總是以高頻率提取的頭IO個氨基酸中包括被校 驗的Cys、 Gln、 Trp、 Orn和Arg。因此,清楚,使用這些氨基酸作為 解釋變量的多變量判別式具有筌別2組癌癥組和非癌癥組的能力(圖 40)。
實施例0210
對通過活組織#r查診斷的癌癥患者組的血液樣品和非癌癥患者組 的血液樣品進行血液中的氨基酸濃度的測量。圖41是顯示癌癥患者和 非癌癥患者的氨基酸解釋變量的分布的箱線圖。為了鑒別癌癥組和非 癌癥組的目的,進行2組之間的t測試。
0211正如與非癌癥組比較的,在癌癥組中,Ser、 Glu、 Pro、 ABA、 lie和Orn顯著地提高,His和Trp顯著地降低。因此,清楚的 是氨基酸解釋變量Ser、 Glu、 Pro、 ABA、 Ile、 Orn、 His和Trp具有鑒 別2組癌癥組和非癌癥組的能力。
0212此外,進行使用在ROC曲線(圖42)的曲線下面積(AUC) 的評估用于鑒別2組癌癥組和非癌癥組,這基于各自的氨基酸解釋變 量,AUC顯示氨基酸解釋變量Ser、 Glu、 Pro、 ABA、 lie和Orn的數(shù) 值大于0.6.因此,清楚的是,氨基酸解釋變量Ser、 Glu、 Pro、 ABA、 lie和Orn具有鑒別2組癌癥組和非癌癥組的能力。
實施例0213使用在實施例6中使用的樣品數(shù)據(jù)。期望檢索鑒別2組 癌癥組和非癌癥組關(guān)于癌癥鑒別的性能最大化的指數(shù),并從多種具有等同性能的指數(shù)中獲得指數(shù)式4。
指數(shù)式4. <formula>formula see original document page 66</formula>0214對基于指數(shù)式4的癌癥診斷性能進行評估,其基于ROC 曲線(圖43)的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得 了 0.855±0.002的AUC (95%置信區(qū)間0.816 ~ 0.895 )。如果假定癌癥 組的癥狀發(fā)病率為0.8%,截止值為0.551,通過確定指數(shù)式1鑒別2 組癌癥組和非癌癥組的最佳截止值時,所獲得的靈敏度為78.72%,特 異性為76.30%,陽性預(yù)測值為2.61%,陰性預(yù)測值為99.78%,正確診 斷率為76.32% (圖43)。因此,發(fā)現(xiàn)指數(shù)式4是具有高診斷性能的可 以使用的指數(shù)。除此之外,獲得了多種分數(shù)式,其具有與指數(shù)式4具 有等同鑒別性能。這些分數(shù)式表示在圖44和45中。圖44和45中所 呈現(xiàn)的判別式的系數(shù)的各自數(shù)值可以是通過乘以實數(shù)的數(shù)值,或者通 過加上任意常數(shù)而獲得的數(shù)值。
實施例8
0215使用在實施例6中使用的樣品數(shù)據(jù)。通過Logistic分析(基 于BIC最小標準的解釋變量覆蓋方法)檢索關(guān)于癌癥鑒別2組癌癥和 非癌癥性能最大化的指數(shù),并獲得作為指數(shù)式5的Logistic回歸方程, 其由Glu、 Gly、 ABA、 Val、 His和Lys構(gòu)成(氨基酸解釋變量Glu、 Gly、 ABA、 Val、 His和Lys的數(shù)字系數(shù)以及常數(shù)在相同數(shù)量級上分別 是
<formula>formula see original document page 66</formula>
0216對基于指數(shù)式5的癌癥診斷性能進行評估,其基于ROC 曲線(圖46)的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得 了 0.865±0.020的AUC (95%置信區(qū)間0.826 ~ 0.903 )。因此,發(fā)現(xiàn)指 數(shù)式5是具有高診斷性能的可以使用的指數(shù)。如果假定癌癥組的癥狀 發(fā)病率為0.8%,截止值為0.298,通過確定指數(shù)式4鑒別2組癌癥組和 非癌癥組的最佳截止值時,所獲得的靈敏度為81.6%,特異性為78.9%,陽性預(yù)測值為3.02%,陰性預(yù)測值為99.81%,正確^貪斷率為78.92%(圖 46)。因此,發(fā)現(xiàn)指數(shù)式5是具有高診斷性能的可以使用的指數(shù)。除此 之外,獲得了多種Logistic回歸方程,其具有與指數(shù)式5具有等同鑒別 性能。這些Logistic回歸方程表示在圖47和48中。圖47和48中所呈 現(xiàn)的方程的系數(shù)的各自數(shù)值可以是乘以實數(shù)的數(shù)值。
實施例9
0217使用在實施例6中所使用的樣品數(shù)據(jù)。通過線性判別式 分析(解釋變量覆蓋方法)檢索關(guān)于癌癥鑒別2組癌癥和非癌癥性能 最大化的指數(shù),并獲得作為指數(shù)式6的線性判別式函數(shù),其由解釋變 量Glu、 Ala、 ABA、 Val、 His和Orn構(gòu)成(氨基酸解釋變量Glu、 Ala、 ABA 、 Val 、 His和Orn的數(shù)字系數(shù)在相同數(shù)量級上分別是 1±0.02, 0.05±0.0018,
1.4209±0.0352, -0.1966土0.0036, —0.7279±0.0133,和 .3416±0.0110,)。
0218對基于指數(shù)式6的癌癥診斷性能進行評估,其基于ROC 曲線(圖49)的AUC結(jié)合2組癌癥組和非癌癥組之間的鑒別,并獲得 了 0.854±0.021的AUC (95%置信區(qū)間0.814 ~ 0.894 )。因此,發(fā)現(xiàn)指 數(shù)式6是具有高診斷性能的可以使用的指數(shù)。如果假定癌癥組的癥狀 發(fā)病率為0.8%,通過確定指數(shù)式6鑒別2組癌癥組和非癌癥組的最佳 截止值時,所獲得的截止值為-8.07,靈敏度為81.6%,特異性為74.0%, 陽性預(yù)測值為2.47%,陰性預(yù)測值為99.80%,正確診斷率為74.1% (圖 49)。因此,發(fā)現(xiàn)指數(shù)式6是具有高診斷性能的可以使用的指數(shù)。除此 之外,獲得了多種線性判別式方程,其具有與指數(shù)式6具有等同鑒別 性能。這些線性判別式方程表示在圖50和51中。圖50和51中所呈 現(xiàn)的判別式的系數(shù)的各自數(shù)值可以是乘以實數(shù)的數(shù)值,或者通過加上 任意常數(shù)獲得的數(shù)值。
實施例10
0219使用在實施例6中所使用的樣品數(shù)據(jù)。通過解釋變量覆 蓋方法提取所有用于進行鑒別關(guān)于癌癥的2組癌癥組和非癌癥組的線 性判別式。假定在每個判別式中出現(xiàn)的氨基酸解釋變量的最大值是4, 計算滿足該條件的每個判別式的ROC曲線下的面積。這里,在判別式中出現(xiàn)的測量ROC曲線下的面積是0.8、 0.775、 0.75、 0.725和0.7或 更大的氨基酸的頻率,在總是以高頻率提取的頭IO個氨基酸中包括被 校驗的Glu、 His、 Trp、 Orn、 Ser和ABA。因此,清楚,使用這些氨 基酸作為解釋變量的多變量判別式具有鑒別2組癌癥組和非癌癥組的 能力(圖52)。
工業(yè)實用性
0220正如上面所討論的,根據(jù)本發(fā)明的評估癌癥狀態(tài)的方法、癌 癥評估裝置、癌癥評估方法、癌癥評估系統(tǒng)、癌癥評估程序和記錄介 質(zhì)可以廣泛用于許多工業(yè)領(lǐng)域,特別是醫(yī)藥、食品和醫(yī)學領(lǐng)域,并在 生物信息學中非常有用,例如進行癌癥的疾病狀態(tài)預(yù)測,疾病風險預(yù)
測和蛋白質(zhì)組學(proteome)和代謝物組學(metabolome )分析。
權(quán)利要求
1.評估癌癥狀態(tài)的方法,其包括測量步驟,其測量關(guān)于從待評估的個體收集的血液中氨基酸的濃度值的氨基酸濃度數(shù)據(jù);以及濃度值標準評估步驟,其基于在測量步驟所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一個的濃度值,對個體中的癌癥狀態(tài)進行評估。
2. 根據(jù)權(quán)利要求1的評估癌癥狀態(tài)的方法,其中濃度值標準評估步驟進一步包括濃度值標準筌別步驟,其鑒別癌癥患者和無癌癥個體,這基于在測量步驟中所測量的個體的氨基酸濃度數(shù)據(jù)中所包含的Cys、Gln、 Trp、 Orn、 Arg、 GIu、 His、 Ser和ABA中的至少一個的濃度值。
3. 根據(jù)權(quán)利要求1的評估癌癥狀態(tài)的方法,其中所述濃度標準評估步驟還包括判別式值計算步驟,其計算作為多變量判別式的值的判別式值,這基于在測量步驟測量的個體的氨基酸濃度數(shù)據(jù)中包含的Cys、 Gln、Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值與之前建立的利用氨基酸濃度作為解釋變量的多變量判別式二者;和判別式值標準評估步驟,其評估個體中的癌癥狀態(tài),這基于在判別式值計算步驟中計算的判別式值,其中多變量判別式含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
4, 根據(jù)權(quán)利要求3的評估癌癥狀態(tài)的方法,其中判別式值標準評估步驟還包括判別式值標準鑒別步驟,其鑒別癌癥患者和無癌癥個體,這基于在判別式值計算步驟計算的判別式值。
5. 根據(jù)權(quán)利要求4的評估癌癥狀態(tài)的方法,其中多變量判別式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
6. 根據(jù)權(quán)利要求5的評估癌癥狀態(tài)的方法,其中多變量判別式是式1或式2:<formula>formula see original document page 2</formula>a2xGlu/His+b2xSer/Trp+c2xVal/Lys+d2xPro/Arg+e2 (式2)其中式1中的a!和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
7. 根據(jù)權(quán)利要求4的評估癌癥狀態(tài)的方法,其中多變量判別式是Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量機所生成的判別式、通過Mahalanobis廣義距離方法所生成的判別式、通過典種:^ 、'工,、"'、、,"
8. 根據(jù)權(quán)利要求7的評估癌癥狀態(tài)的方法,其中多變量判別式是利用Orn、 Cys、 Tau、 Trp、 Gln和Cit作為解釋變量的Logistic回歸方程,利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式,利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線性判別式。
9. 癌癥評估裝置,其包括控制單元和存儲器單元用于評估待評估個體中的癌癥狀態(tài),其中控制單元包括判別式值計算單元,其計算作為多變量判別式的值的判別式值,這基于在先前獲得的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù)據(jù)中所包含的Cys、 Gln、 Trp、 Om、 Arg、 Glu、 His、 Ser和ABA中的至少一個的濃度值,以及在存儲器單元中所存儲的利用氨基酸濃度作為解釋變量的多變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、His、 Ser和ABA中的至少一個作為解釋變量;和判別式值標準評估單元,其評估個體中的癌癥狀態(tài),這基于判別式值計算單元所計算的判別式值。
10. 根據(jù)權(quán)利要求9的癌癥評估裝置,其中判別式值標準評估單元還包括判別式值標準鑒別單元,其鑒別癌癥患者和無癌癥個體,這基于判別式值計算單元所計算的判別式值。
11. 根據(jù)權(quán)利要求10的癌癥評估裝置,其中多變量判別式表達為一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的分數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
12. 根據(jù)權(quán)利要求11的癌癥評估裝置,其中多變量判別式是式1或式2:<formula>formula see original document page 4</formula>其中式1中的a!和t^是任意非零實數(shù),式l中的d是任意實數(shù),式2 中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
13. 根據(jù)權(quán)利要求10的癌癥評估裝置,其中多變量判別式是 Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量^L所生 成的判別式、通過Mahalanobis廣義距離方法所生成的判別式、通過典 型判別式分析所生成的判別式和通過決策樹所生成的判別式的任意一 種。
14. 根據(jù)權(quán)利要求13的癌癥評估裝置,其中多變量判別式是利用 Orn、 Cys、 Tau、 Trp、 Gln和Cit作為解釋變量的Logistic回歸方程, 利用Om、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式, 利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸 方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線 性判別式。
15. 根據(jù)權(quán)利要求9~14任一項的癌癥評估裝置,其中控制單元還 包括多變量判別式生成單元,其生成存儲在存儲器單元中的多變量判 別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息,其中癌癥狀態(tài)信息 含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌癥狀態(tài)指數(shù)數(shù)據(jù),其中多變量判別式生成單元還包括候選多變量判別式生成單元,其從癌癥狀態(tài)信息生成作為多變量 判別式候選的候選多變量判別式,這基于預(yù)定的生成判別式的方法;候選多變量判別式校驗單元,其校驗由候選多變量判別式生成單 元生成的候選多變量判別式,這基于預(yù)定的校驗方法;以及解釋變量選擇單元,其從通過候選多變量判別式校驗單元所獲得 的校驗結(jié)果選擇候選多變量判別式的解釋變量,這基于預(yù)定的解釋變 量選擇方法,這樣選擇了用于生成候選多變量判別式中的癌癥狀態(tài)信息中所含有的氨基酸濃度數(shù)據(jù)的組合,以及其中,多變量判別式生成單元生成了多變量判別式,其通過從多 個候選多變量判別式選擇用作多變量判別式的候選多變量判別式,這 基于通過重復(fù)執(zhí)行候選多變量判別式生成單元、候選多變量判別式校 驗單元和解釋變量選擇單元而積累的校驗結(jié)果。
16. 癌癥評估方法,其評估待評估的個體中癌癥狀態(tài),所述方法是 利用信息處理裝置進行的,其中所述信息處理裝置包括控制單元和存 儲器單元,所述方法包括(i) 判別式值計算步驟,其計算作為多變量判別式數(shù)值的判別式 值,這基于在之前所獲得的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù) 據(jù)中Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個 的濃度值以及存儲在存儲器單元中利用氨基酸濃度作為解釋變量的多 變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser 和ABA中的至少一個作為解釋變量;以及(ii) 判別式值標準評估步驟,其評估個體中的癌癥狀態(tài),這基于 在判別式值計算步驟中所計算的判別式值,其中步驟(i)和(ii)都是通過控制單元執(zhí)行的。
17. 根據(jù)權(quán)利要求16的癌癥評估方法,其中判別式值標準評估步 驟還包括判別式值標準鑒別步驟,其鑒別癌癥患者和無癌癥個體,這 基于在判別式值計算步驟中所計算的判別式值。
18. 根據(jù)權(quán)利要求17的癌癥評估方法,其中多變量判別式表達為 一個分數(shù)式,或者多個分數(shù)式的總和,并且在構(gòu)成多變量判別式的分 數(shù)式的分子和分母的任一個或二者中包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量。
19. 根據(jù)權(quán)利要求18的癌癥評估方法,其中多變量判別式是式1 或式2:<formula>formula see original document page 5</formula>其中式1中的a,和b!是任意非零實數(shù),式l中的d是任意實數(shù),式2中的a2、 b2、 C2和d2是任意非零實數(shù),式2中的e2是任意實數(shù)。
20. 根據(jù)權(quán)利要求17的癌癥評估方法,其中多變量判別式是 Logistic回歸方程、線性判別式、多重回歸方程、通過支持向量機所生 成的判別式、通過Mahalanobis廣義距離方法所生成的判別式、通過典種:'- 、'工、、"'、、,- 、
21. 根據(jù)權(quán)利要求20的癌癥評估方法,其中多變量判別式是利用 Orn、 Cys、 Tau、 Trp、 Gln和Cit作為解釋變量的Logistic回歸方程, 利用Orn、 Cys、 Arg、 Tau、 Trp和Gln作為解釋變量的線性判別式, 利用Glu、 Gly、 ABA、 Val、 His和Lys作為解釋變量的Logistic回歸 方程,或者利用Glu、 Ala、 ABA、 Val、 His和Orn作為解釋變量的線 性判別式。
22. 根據(jù)權(quán)利要求16~21任一項的癌癥評估方法,其中所述方法 還包括控制單元執(zhí)行的多變量判別式生成步驟,其生成存儲在存儲器 單元中的多變量判別式,這基于存儲在存儲器單元的癌癥狀態(tài)信息, 其中癌癥狀態(tài)信息含有氨基酸濃度數(shù)據(jù)和關(guān)于指示癌癥狀態(tài)指數(shù)的癌 癥狀態(tài)指數(shù)數(shù)據(jù),其中多變量判別式生成步驟還包括候選多變量判別式生成步驟,其從癌癥狀態(tài)信息生成作為多變量 判別式候選的候選多變量判別式,這基于預(yù)定的生成判別式的方法;候選多變量判別式校驗步驟,其校驗在候選多變量判別式生成步 驟生成的候選多變量判別式,這基于預(yù)定的校驗方法;以及解釋變量選擇步驟,其從在候選多變量判別式校驗步驟中所獲得 的校驗結(jié)果選擇候選多變量判別式的解釋變量,這基于預(yù)定的解釋變 量選擇方法,這樣選擇了用于生成候選多變量判別式中的癌癥狀態(tài)信 息中所含有的氨基酸濃度數(shù)據(jù)的組合,以及其中在多變量判別式生成步驟,生成了多變量判別式,其通過從 多個候選多變量判別式選擇用作多變量判別式的候選多變量判別式, 這基于通過重復(fù)執(zhí)行候選多變量判別式生成步驟、候選多變量判別式 校驗步驟和解釋變量選擇步驟而積累的校驗結(jié)果。
23. 癌癥評估系統(tǒng),其包括癌癥評估裝置,該裝置包括控制單元和 存儲器單元以評估待評估個體中的癌癥狀態(tài);以及信息通信終端裝置,其提供關(guān)于通過網(wǎng)絡(luò)為相互通信連接的個體中氨基酸濃度值的氨基酸 濃度數(shù)據(jù),其中,信息通信終端裝置包括氨基酸濃度數(shù)據(jù)發(fā)送單元,其將個體的氨基酸濃度數(shù)據(jù)傳輸?shù)桨┌Y評估裝置;以及評估結(jié)果接收單元,其接收從癌癥評估裝置傳輸?shù)膫€體的癌癥狀 態(tài)的評估結(jié)果,其中,癌癥評估裝置的控制單元包括氨基酸濃度數(shù)據(jù)接收單元,其接受從信息通信終端裝置傳輸?shù)膫€ 體的氨基酸濃度數(shù)據(jù);判別式值計算單元,其計算作為多變量判別式的數(shù)值的判別式值, 這基于氨基酸濃度數(shù)據(jù)接收單元所接受的個體的氨基酸濃度數(shù)據(jù)中所 包含的Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一 個的濃度值以及存儲在存儲器單元中的利用氨基酸濃度作為解釋變量 的多變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量;判別式值標準評估單元,其評估個體中的癌癥狀態(tài),這基于判別 式值計算單元所計算的判別式值;以及評估結(jié)果發(fā)送單元,其將通過判別式值標準評估單元所獲得的個 體的評估結(jié)果傳輸?shù)叫畔⑼ㄐ沤K端裝置。
24. 癌癥評估程序產(chǎn)品,其使得包括控制單元和存儲器單元的信息 處理裝置執(zhí)行評估待評估的個體中癌癥狀態(tài)的方法,該方法包括(i) 判別式值計算步驟,其計算作為多變量判別式數(shù)值的判別式 值,這基于在之前所獲得的關(guān)于個體中氨基酸濃度值的氨基酸濃度數(shù) 據(jù)中所包含Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至 少 一個的濃度值以及存儲在存儲器單元中利用氨基酸濃度作為解釋變 量的多變量判別式二者,其中含有Cys、 Gln、 Trp、 Orn、 Arg、 Glu、 His、 Ser和ABA中的至少一個作為解釋變量,以及(ii) 判別式值標準評估步驟,其評估個體中的癌癥狀態(tài),這基于 在判別式值計算步驟中所計算的判別式值,其中,步驟(i)和(ii)都是通過控制單元執(zhí)行的。
25. 計算機可讀記錄介質(zhì),其包含記錄在其上的根據(jù)權(quán)利要求24的癌癥評估程序產(chǎn)品。
全文摘要
提供了評估癌癥狀態(tài)的方法,癌癥評估裝置,癌癥評估方法,癌癥評估系統(tǒng),癌癥評估程序和記錄介質(zhì),其能夠精確評估癌癥狀態(tài),這利用血液的氨基酸中涉及癌癥狀態(tài)的氨基酸的濃度。根據(jù)本發(fā)明評估癌癥狀態(tài)的方法,測量從待評估個體手機的血液中關(guān)于氨基酸濃度的氨基酸濃度數(shù)據(jù),并評估個體的癌癥狀態(tài),這基于在個體的所測量氨基酸濃度數(shù)據(jù)中所包含的Cys、Gln、Trp、Orn、Arg、Glu、His、Ser和ABA中的至少一個濃度值。
文檔編號G06F19/24GK101568838SQ20078004760
公開日2009年10月28日 申請日期2007年12月18日 優(yōu)先權(quán)日2006年12月21日
發(fā)明者今泉明, 岡本直幸, 安東敏彥 申請人:味之素株式會社