基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法
【專利摘要】本發(fā)明涉及一種肺結(jié)節(jié)良惡性鑒別方法,特別涉及一種基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法。通過采集良惡性肺結(jié)節(jié)的原始樣本集S0。針對良惡性肺結(jié)節(jié)的原始樣本集S0進(jìn)行樣本約簡,得到支持向量機(jī)的良惡性肺結(jié)節(jié)的最終訓(xùn)練集S2,然后對約簡后的最終訓(xùn)練集S2進(jìn)行支持向量機(jī)訓(xùn)練,得到最后的分類決策函數(shù),對未知的肺結(jié)節(jié)樣本xi'進(jìn)行支持向量機(jī)預(yù)測,得到肺結(jié)節(jié)的良惡性鑒別結(jié)果。本發(fā)明提出一種支持向量機(jī)樣本約簡的方法來提高支持向量機(jī)訓(xùn)練速度,降低空間存儲要求,從而減少肺結(jié)節(jié)的良惡性鑒別時(shí)間,提高醫(yī)師的診斷效率和客觀一致性。
【專利說明】基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種肺結(jié)節(jié)良惡性鑒別方法,特別涉及一種基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法。
【背景技術(shù)】
[0002]目前,肺癌已經(jīng)成為危害人類身體健康的惡性腫瘤之一,而且肺癌的發(fā)病率和死亡率近年來依然呈上升趨勢。在我國,肺癌每年約有40萬的患者死亡。據(jù)美國癌癥協(xié)會提供的資料,僅2006年美國新增肺癌病例17.4萬人,同年有16.2萬人死于肺癌。然而,目前肺癌的治療效果并不好,主要原因是肺癌在早期階段沒有明顯的臨床癥狀,而且缺乏有效的早期檢測與診斷手段。80%的患者在治療時(shí)已經(jīng)屬于肺癌中晚期,錯(cuò)失肺癌的最佳治療時(shí)期,其5年的存活率不高于15%。肺癌患者如果能在早期進(jìn)行檢測和診斷,5年的存活率將接近與50%。因此,肺癌早期檢測與診斷技術(shù)的發(fā)展對治療肺癌患者有著重大意義與價(jià)值。
[0003]目前,醫(yī)學(xué)領(lǐng)域?qū)Ψ伟┻M(jìn)行早期診斷主要依靠計(jì)算機(jī)斷層掃描技術(shù)(ComputedTomography, CT)。1969年,英國工程師Housfield成功研制出計(jì)算機(jī)斷層掃描技術(shù)。1974年Ledly成功設(shè)計(jì)CT裝置,CT開始進(jìn)入醫(yī)療領(lǐng)域并得到發(fā)展。CT掃描技術(shù)在醫(yī)療領(lǐng)域發(fā)揮其優(yōu)勢的同時(shí),會使得患者的CT掃描圖片大幅度增加:1mm層厚的CT掃描圖像將達(dá)到400-500層,2mm的層厚CT掃描圖像將達(dá)到100-200層,一個(gè)患者病例的全肺圖片將達(dá)到200-500張,面對如此龐大數(shù)量的圖片,醫(yī)師僅憑肉眼要從中辨別出哪些組織正?;蚴遣∽?、是良性病變、是惡性腫瘤,必須認(rèn)真檢查每一張圖片,醫(yī)師的工作勢必會變的枯燥和繁重,而且容易造成醫(yī)師的疲勞,出現(xiàn)誤診和漏診的情況。因此,為了減輕醫(yī)師閱片的工作負(fù)擔(dān),提高肺結(jié)節(jié)的檢測效率和診斷準(zhǔn)確性,產(chǎn)生了計(jì)算機(jī)輔助診斷(Computer AidedDiagnosis, CAD)系統(tǒng)。
[0004]計(jì)算機(jī)輔助診斷系統(tǒng),是基于醫(yī)學(xué)影像知識,結(jié)合數(shù)字圖像處理和模式識別等技術(shù),通過對CT圖片進(jìn)行相關(guān)的分析處理,把可疑的肺結(jié)節(jié)位置標(biāo)記出來并且將結(jié)節(jié)特征化描敘,然后將這些參考信息提供給放射醫(yī)師進(jìn)行診斷。肺癌CAD系統(tǒng)能夠?qū)Ψ尾繀^(qū)域進(jìn)行分割、提取、量化、分類、鑒別,然后再將結(jié)果提供給放射醫(yī)師診斷使用,這樣可以有效降低醫(yī)師的工作量,緩解疲勞,降低誤診率和漏診率。研究表明,肺癌CAD系統(tǒng)能夠提高醫(yī)生診斷的準(zhǔn)確率和客觀一致性??梢?,肺癌CAD技術(shù)的發(fā)展對肺癌的早期檢測和診斷有著不可估量的作用與意義。
[0005]支持向量機(jī)雖然取得較好發(fā)展,然而它仍然有不足之處。支持向量機(jī)的本質(zhì)是求解數(shù)學(xué)上的凸二次規(guī)劃問題,在面臨大量的數(shù)據(jù)樣本時(shí)訓(xùn)練速度很慢,而且空間存儲要求很大,這些不足會限制它在各領(lǐng)域的應(yīng)用效果。如何克服不足,提高支持向量機(jī)的訓(xùn)練速度,推廣支持向量機(jī)的應(yīng)用范圍和提高應(yīng)用效果,是很有價(jià)值和意義。
【發(fā)明內(nèi)容】
[0006]針對現(xiàn)有技術(shù)存在的不足,本發(fā)明提供一種訓(xùn)練速度快,空間存儲要求小的基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法。
[0007]本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法,具體步驟如下:
[0008]步驟1:采集良惡性肺結(jié)節(jié)的原始樣本集Stl ;樣本集是二分類型的數(shù)據(jù):一類是正類數(shù)據(jù),代表良性肺結(jié)節(jié);另一類是負(fù)類數(shù)據(jù),代表惡性肺結(jié)節(jié);
[0009]步驟2:針對良惡性肺結(jié)節(jié)的原始樣本集Stl進(jìn)行樣本約簡,得到支持向量機(jī)的良惡性肺結(jié)節(jié)的最終訓(xùn)練集S2;以樣本點(diǎn)和兩類樣本數(shù)據(jù)中心連線上的兩個(gè)點(diǎn)構(gòu)成一個(gè)三角形;記樣本點(diǎn)為三角形的頂點(diǎn),然后分別計(jì)算出三角形兩個(gè)底角的余弦值;再將兩個(gè)余弦值作商與閾值進(jìn)行比較,進(jìn)而挑選出邊界樣本;
[0010]步驟3:對約簡后的最終訓(xùn)練集&進(jìn)行SVM訓(xùn)練,得到最后的分類決策函數(shù)f(x);給定二分類問題的訓(xùn)練集
【權(quán)利要求】
1.基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法,其特征在于:具體步驟如下: 步驟1:采集良惡性肺結(jié)節(jié)的原始樣本集Stl ;樣本集是二分類型的數(shù)據(jù):一類是正類數(shù)據(jù),代表良性肺結(jié)節(jié);另一類是負(fù)類數(shù)據(jù),代表惡性肺結(jié)節(jié); 步驟2:針對良惡性肺結(jié)節(jié)的原始樣本集Stl進(jìn)行樣本約簡,得到支持向量機(jī)的良惡性肺結(jié)節(jié)的最終訓(xùn)練集S2 ;以樣本點(diǎn)和兩類樣本數(shù)據(jù)中心連線上的兩個(gè)點(diǎn)構(gòu)成一個(gè)三角形;記樣本點(diǎn)為三角形的頂點(diǎn),然后分別計(jì)算出三角形兩個(gè)底角的余弦值;再將兩個(gè)余弦值作商與閾值進(jìn)行比較,進(jìn)而挑選出邊界樣本; 步驟3:對約簡后的最終訓(xùn)練集S2進(jìn)行支持向量機(jī)訓(xùn)練,得到最后的分類決策函數(shù)f(x);給定二分類問題的訓(xùn)練集r={(u)L GlxF5其中Xi e X=RnJi e {+1,-1};得到最終的分類決策函數(shù):
2.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法,其特征在于: 所述的步驟2中支持向量機(jī)樣本約簡算具體步驟如下: 步驟2.1:求出良惡性肺結(jié)節(jié)的原始樣本集Stl中正、負(fù)類數(shù)據(jù)的最小圓0l,O2 ;利用支持向量域描述算法分別計(jì)算2個(gè)圓的圓心0l,O2坐標(biāo);和半徑rι,r2的值;再分別求得球心間的距離O1O2=I O1-O2 I和超球半徑和!T^r2 ; 步驟2.2:判斷正負(fù)類數(shù)據(jù)是否有重疊部分;通過比較兩個(gè)圓半徑和ri+r2與圓心間的距離O1O2,可知有兩種情形:a)ri+r2〈0l02則正負(fù)類數(shù)據(jù)無重疊部分;b)ri+r2 ^ O1O2則正負(fù)類數(shù)據(jù)有重疊部分;點(diǎn)A1, A2分別為圓0l,O2與線段O1O2的交點(diǎn),點(diǎn)ο為線段A1A2的中點(diǎn),在上述的兩種情形下分別計(jì)算線段A1A2的中點(diǎn)ο的坐標(biāo),經(jīng)過計(jì)算得知兩種情形下點(diǎn)O的坐標(biāo)計(jì)算公式一致,皆為
3.根據(jù)權(quán)利要求2所述的基于支持向量機(jī)樣本約簡的肺結(jié)節(jié)良惡性鑒別方法,其特征在于:所述步驟2.7:挑選出良惡性肺結(jié)節(jié)的最終訓(xùn)練集S2的具體方法如下:
【文檔編號】G06K9/66GK103778444SQ201410007463
【公開日】2014年5月7日 申請日期:2014年1月7日 優(yōu)先權(quán)日:2014年1月7日
【發(fā)明者】郭薇, 張國棟, 周炬, 吳海萍 申請人:沈陽航空航天大學(xué)