本發(fā)明屬于醫(yī)療影像大數(shù)據(jù)分類研究領域,特別是涉及一種基于機器學習的肺部氣胸ct影像分類診斷方法。
背景技術:
隨著計算機技術和醫(yī)療影像技術的發(fā)展,特別是最近發(fā)展迅速的機器學習,深度學習和大數(shù)據(jù)技術,給現(xiàn)代醫(yī)療影像診斷的發(fā)展提供了巨大的技術支持。因此有必要將這些技術運用到計算機輔助診斷系統(tǒng)中,利用機器學習,深度學習和大數(shù)據(jù)技術自身的強大優(yōu)勢,進一步提高醫(yī)學影像自動診斷的準確率和誤診率,減輕臨床醫(yī)生的負擔。
氣胸一般認為是氣體進入胸膜腔形成氣體堆積狀態(tài),造成氣胸的原因有多種。一般認為是由于肺部組織,氣管,支氣管破裂,空氣逸入胸膜腔或者是因為胸壁傷口穿破胸膜,造成胸膜腔與外界聯(lián)通,外界空氣進入所致。典型癥狀為突發(fā)性胸痛,繼之有胸悶和呼吸困難,并可有刺激性咳嗽。臨床上氣胸可以分為閉合性氣胸,開放性氣胸,張力性氣胸等,其中閉合性氣胸胸膜破裂口較小,隨肺萎縮而閉合,空氣不再繼續(xù)進入胸膜腔;開放性氣胸患者常在傷后迅速出現(xiàn)嚴重呼吸困難、不安、脈搏細弱頻數(shù)、發(fā)紺和休克。檢查時可見胸壁有明顯創(chuàng)口通入胸腔,并可聽到空氣隨呼吸進出的“嘶嘶”聲音。傷側叩診鼓音,呼吸音消失,有時可聽到縱隔擺動聲。張力性氣胸破裂口呈單向活瓣或活塞作用,胸膜腔內(nèi)空氣越積越多。
支持向量機(supportvectormachine)是一種分類算法,通過尋求結構化風險最小來提高學習機泛化能力,實現(xiàn)經(jīng)驗風險和置信范圍的最小化,從而達到在統(tǒng)計樣本量較少的情況下,亦能獲得良好統(tǒng)計效果的目的。通俗來講,它是一種二類分類模型,其基本模型定義為特征空間上的間隔最大的線性分類器,即支持向量機的學習策略便是間隔最大化,最終可轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解。因此本發(fā)明利用醫(yī)學圖像處理技術和svm對氣胸進行分類診斷,達到輔助醫(yī)生診斷和提高診斷準確率降低誤診率的目的。
技術實現(xiàn)要素:
針對現(xiàn)有氣胸ct影像完全依靠臨床醫(yī)生主觀診斷的不足,本發(fā)明公開了一種基于機器學習的肺部氣胸ct影像分類診斷方法。
為了實現(xiàn)上述目的,本發(fā)明公開的分類方法步驟如下:
步驟1,從臨床醫(yī)院中獲得氣胸ct影像數(shù)據(jù)并進行氣胸區(qū)域標定操作;步驟2,對標定后的氣胸ct影像進行圖像處理;步驟3,對經(jīng)過圖像處理的ct影像數(shù)據(jù)進行正負樣本標定,得到正樣本和負樣本;步驟4,利用得到的樣本數(shù)據(jù)對svm進行訓練預測診斷;步驟5,用訓練好的svm模型對肺部氣胸ct影像進行分類診斷。
進一步地,所述步驟1中的氣胸標定區(qū)域包括氣胸區(qū)域的邊界,中心點等。
進一步地,所述步驟2中對標定后的氣胸ct影像進行圖像處理具體步驟包括:
(1)肺部區(qū)域的分割,濾波,增強操作,首先自適應閾值法對氣胸ct影像進行分割操作,得到二值化圖像;然后由于肺部ct影像自身的復雜性,存在背景床等噪聲區(qū)域,因此對分割后的ct圖像需要進行去除床的操作,采用的方法是區(qū)域生長法,在經(jīng)過閾值分割后的肺mask上設置種子點生長并進行腐蝕操作去掉面積較小的區(qū)域;再對得到的肺mask區(qū)域進行高斯濾波去除噪聲并進行增強操作,最后對得到的肺區(qū)域進行聯(lián)通域分析重新生成標簽獲取聯(lián)通域的面積,保留面積最大的區(qū)域作為最終的肺胸腔;
(2)因為人體胸腔內(nèi)部結構復雜,存在多個非肺部區(qū)域和組織,這反映到肺部ct影像上就是各種噪聲,因此需要對肺胸腔中的這些噪聲進行去除,去除方法包括直接閾值分割和基于手動設定的規(guī)則法進行去除,設定規(guī)則包括這些噪聲的面積、分散度、距離三個屬性,對符合條件的區(qū)域進行保留,不符合條件的區(qū)域進行舍去,并結合形態(tài)學操作進行多次膨脹腐蝕操作去掉這些噪聲區(qū)域,得到最終的肺實質(zhì)分割圖像。
進一步地,所述步驟3中對經(jīng)過圖像處理的ct影像數(shù)據(jù)進行正負樣本標定,得到正樣本和負樣本的步驟包括:
(1)采用高斯濾波操作對得到的肺實質(zhì)圖像進行濾波操作,去掉某些異常噪聲。其中高斯濾波操作中的高斯函數(shù)和高斯核如下:
(2)采用自適應閾值法加形態(tài)學操作提取低密度灶區(qū)域;
(3)對得到的低密度灶區(qū)域進行聯(lián)通域分析得到氣胸區(qū)域和非氣胸區(qū)域,其中的氣胸區(qū)域標注為正樣本,非氣胸區(qū)域標注為負樣本。
進一步地,所述步驟4中對svm進行訓練預測診斷過程包括:
(1)將樣本數(shù)據(jù)分為訓練集和測試集;
(2)利用訓練集對svm進行訓練得到訓練好的svm模型,本發(fā)明采用的主要特征包括圓度,方差,峰度,偏度,灰度共生矩陣中的對比度,差異性,熵,相關性,角二階矩等,表達式為:
圓度:
方差:
偏度:
熵:-∑p(i,j)ln[p(i,j)]角二階矩:
其中n為圖像像素總和,μ為圖像均值,g(i,j)為圖像像素值,r為圖像大小,p(i,j)為圖像(i,j)點的概率值。
(3)將svm模型在測試集上進行測試得到測試結果。
與現(xiàn)有肺部氣胸ct影像分類診斷方法相比,本發(fā)明的優(yōu)勢在于:(1)利用機器學習的方法,將臨床醫(yī)生從繁重的閱片任務中解脫出來,減輕了醫(yī)生負擔;(2)將以往完全依據(jù)醫(yī)生的經(jīng)驗和知識進行氣胸疾病診斷改為利用計算機進行診斷,提高了診斷的準確率和誤診率。
附圖說明
為更加清楚的說明本發(fā)明所采用的實現(xiàn)方法,現(xiàn)將對實施例進行簡單的介紹,下面描述中的附圖僅僅是本發(fā)明中的一些實施例。
圖1是本發(fā)明的流程圖。
圖2是本發(fā)明所采用的臨床氣胸ct影像原始圖像。
圖3是本發(fā)明二值化閾值分割的效果圖。
圖4是本發(fā)明背景移除后的圖像效果圖。
圖5是本發(fā)明去除肺實質(zhì)部分的效果圖。
圖6是本發(fā)明最終得到的肺區(qū)域效果圖。
圖7是本發(fā)明得到的正樣本效果圖。
圖8是本發(fā)明得到的負樣本效果圖。
具體實施方式
以下結合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1所示,基于機器學習的肺部氣胸ct影像分類診斷方法,步驟包括:步驟1,從臨床醫(yī)院中獲得氣胸ct影像數(shù)據(jù)并進行氣胸區(qū)域標定操作,其標定區(qū)域包括氣胸區(qū)域的邊界,中心點等;步驟2,對標定后的氣胸ct影像進行圖像處理;步驟3,對經(jīng)過圖像處理的ct影像數(shù)據(jù)進行正負樣本標定,得到正樣本和負樣本;步驟4,利用得到的樣本數(shù)據(jù)對svm進行訓練預測診斷分類;步驟5,用訓練好的svm模型對肺部氣胸ct影像進行分類診斷。
上述步驟2中主要對標定后的氣胸ct影像進行圖像處理具體包括,肺部區(qū)域的分割,濾波,增強操作,首先自適應閾值法對氣胸ct影像進行分割操作,得到二值化圖像,如圖3所示,由于肺部ct影像自身的復雜性,存在背景床等噪聲區(qū)域,因此對分割后的ct圖像需要進行去除床的操作,采用的方法是區(qū)域生長法,在經(jīng)過閾值分割后的肺mask上設置種子點生長并進行腐蝕操作去掉面積較小的區(qū)域,下一步是對得到的肺mask區(qū)域進行高斯濾波去除噪聲并進行增強操作,最后對得到的肺區(qū)域進行聯(lián)通域分析重新生成標簽獲取聯(lián)通域的面積,保留面積最大的區(qū)域作為最終的肺胸腔,如圖4所示。
由于人體胸腔內(nèi)部結構復雜,存在多個非肺部區(qū)域和組織。這反映到肺部ct影像上就是各種噪聲,因此需要對圖4中的這些噪聲進行去除,去除方法包括直接閾值分割和基于手動設定的規(guī)則法進行去除,如圖5所示。設定規(guī)則包括這些噪聲的面積、分散度、距離三個屬性,對符合條件的區(qū)域進行保留,不符合條件的區(qū)域進行舍去,并結合形態(tài)學操作進行多次膨脹腐蝕操作去掉這些噪聲區(qū)域,得到最終的肺實質(zhì)分割圖像,如圖6所示。
(1)對得到的肺實質(zhì)圖像進行濾波操作,去掉某些異常噪聲,主要采用高斯濾波操作,高斯函數(shù)和高斯核如下:
(2)進行提取低密度灶操作,采用的是自適應閾值法加形態(tài)學操作提取低密度灶區(qū)域,最后對得到的低密度灶區(qū)域進行聯(lián)通域分析得到氣胸區(qū)域和非氣胸區(qū)域,其中的氣胸區(qū)域標注為正樣本,如圖7所示,非氣胸區(qū)域標注為負樣本,如圖8所示。
上述步驟4中對svm進行訓練預測診斷過程包括:
(1)將樣本數(shù)據(jù)分為訓練集和測試集;
(2)利用訓練集對svm進行訓練得到訓練好的svm模型,本發(fā)明采用的主要特征包括圓度,方差,峰度,偏度,灰度共生矩陣中的對比度,差異性,熵,相關性,角二階矩等,表達式為:
圓度:
方差:
偏度:
熵:-∑p(i,j)ln[p(i,j)]角二階矩:
其中n為圖像像素總和,μ為圖像均值,g(i,j)為圖像像素值,r為圖像大小,p(i,j)為圖像(i,j)點的概率值。
(3)將svm模型在測試集上進行測試得到測試結果。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不限于本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等均應包含在本發(fā)明的保護范圍之內(nèi)。