本發(fā)明涉及的是一種醫(yī)療衛(wèi)生領(lǐng)域的技術(shù),具體是一種基于人工智能幫助肺癌篩查的方法及系統(tǒng)。
背景技術(shù):
肺癌高危人群的判斷已有過研究。肺癌高危人群中進(jìn)行低劑量螺旋ct(low-dosecomputedtomography,ldct)檢查是篩查肺癌的有效手段,肺癌早期診斷能有效改善預(yù)后和降低死亡率。準(zhǔn)確確定高危人群不僅能提高篩查效率,還能減少醫(yī)療資源浪費(fèi),避免讓低危人群接受不必要的輻射。當(dāng)前,美國國家綜合癌癥網(wǎng)絡(luò)(nccn)對高危人群的界定以吸煙量、家族史等風(fēng)險(xiǎn)因素寬泛定義,缺乏定量標(biāo)準(zhǔn)。近幾年有研究基于傳統(tǒng)統(tǒng)計(jì)學(xué)方法建立了風(fēng)險(xiǎn)量化的數(shù)學(xué)模型,用于鑒別高低危人群。比較有代表性的為tammemagi等人提出的的plcom2012肺癌篩查模型。然而,用于鑒別肺癌高低危人群的方法仍有待于改進(jìn),另外,針對接受篩查人群的ct影像圖片中發(fā)現(xiàn)的肺結(jié)節(jié),也缺乏有效的良惡性判別模型。ct判讀對專業(yè)水平和臨床經(jīng)驗(yàn)有較高要求,大型三甲醫(yī)院水平較高,可滿足篩查和診療的需求,然而在基層醫(yī)院,由于醫(yī)生經(jīng)驗(yàn)有限,則容易造成誤診、漏診。此外,針對肺癌篩查,醫(yī)療保健信息數(shù)字化程度相對較低,數(shù)據(jù)缺乏有效的管理和整合,電子病歷中所包含的數(shù)據(jù)是非結(jié)構(gòu)化的、格式散亂的、描述性語言居多的數(shù)據(jù),使日益產(chǎn)生的海量數(shù)據(jù)難以得到有效利用。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明針對現(xiàn)有技術(shù)存在的上述不足,提出一種基于人工智能幫助肺癌篩查的方法及系統(tǒng),根據(jù)病例信息數(shù)據(jù)鑒別肺癌高危人群,并基于ct影像中肺結(jié)節(jié)形態(tài)密度等影像特征判別結(jié)節(jié)患者中的可能的惡性結(jié)節(jié)。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
本發(fā)明涉及一種基于人工智能幫助肺癌篩查的方法,通過分別生成鑒別肺癌模型和肺結(jié)節(jié)良惡性評估模型,當(dāng)在線檢測時(shí),實(shí)時(shí)采集對象的基本信息、基本健康信息、一般生活狀態(tài)、目前的呼吸系統(tǒng)癥狀、慢性病與肺病史和吸煙狀態(tài),并通過鑒別肺癌模型和肺結(jié)節(jié)良惡性評估模型檢測得到患癌風(fēng)險(xiǎn)值和結(jié)節(jié)的惡性概率。
所述的鑒別肺癌模型,首先建立病例數(shù)據(jù)并進(jìn)行結(jié)構(gòu)初始化,通過收集肺癌患者和健康人結(jié)構(gòu)化病例數(shù)據(jù)信息,經(jīng)特征提取和特征數(shù)據(jù)標(biāo)準(zhǔn)化處理后,對得到的訓(xùn)練用數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí),通過訓(xùn)練得到鑒別肺癌模型。
所述的肺結(jié)節(jié)良惡性評估模型,首先建立ct片中肺結(jié)節(jié)影像特征信息結(jié)構(gòu),收集確診為惡性的結(jié)節(jié)和確診為良性的結(jié)節(jié)的影像特征,經(jīng)特征提取和特征數(shù)據(jù)標(biāo)準(zhǔn)化處理后,對得到的訓(xùn)練用數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí),通過訓(xùn)練得到肺結(jié)節(jié)良惡性評估模型。
本發(fā)明涉及一種實(shí)現(xiàn)上述方法的系統(tǒng),包括:鑒別肺癌模型模塊、肺結(jié)節(jié)良惡性評估模型模塊、信息采集模塊以及結(jié)果顯示模塊,其中:信息采集模塊分別與鑒別肺癌模型模塊和肺結(jié)節(jié)良惡性評估模型模塊相連,輸出實(shí)時(shí)采集的基本信息、基本健康信息、一般生活狀態(tài)、目前的呼吸系統(tǒng)癥狀、慢性病與肺病史和吸煙狀態(tài),或輸出肺癌患者和健康人結(jié)構(gòu)化病例數(shù)據(jù)信息至鑒別肺癌模型模塊,輸出確診為惡性的結(jié)節(jié)和確診為良性的結(jié)節(jié)的影像特征至肺結(jié)節(jié)良惡性評估模型,鑒別模型生成模塊和肺結(jié)節(jié)良惡性評估模型模塊根據(jù)所得信息分別識別得到患癌風(fēng)險(xiǎn)值和結(jié)節(jié)的惡性概率,結(jié)果顯示模塊通過人機(jī)界面將結(jié)果顯示輸出。
技術(shù)效果
與現(xiàn)有技術(shù)相比,本發(fā)明充分各種相關(guān)特征,通過多維信息進(jìn)行肺癌高低危人群劃分和肺結(jié)節(jié)良惡性評估,可有助于辨別高危人群。
附圖說明
圖1為本發(fā)明流程圖;
圖2為本發(fā)明鑒別肺癌模型模塊示意圖;
圖3為本發(fā)明肺結(jié)節(jié)良惡性評估模型模塊示意圖。
具體實(shí)施方式
如圖1所示,本實(shí)施例通過分別生成鑒別肺癌模型和肺結(jié)節(jié)良惡性評估模型,當(dāng)在線檢測時(shí),實(shí)時(shí)采集對象的基本信息、基本健康信息、一般生活狀態(tài)、目前的呼吸系統(tǒng)癥狀、慢性病與肺病史和吸煙狀態(tài),并通過鑒別肺癌模型和肺結(jié)節(jié)良惡性評估模型檢測得到患癌風(fēng)險(xiǎn)值和結(jié)節(jié)的惡性概率。
所述的鑒別肺癌模型,首先建立病例數(shù)據(jù)并進(jìn)行結(jié)構(gòu)初始化,通過收集肺癌患者和健康人結(jié)構(gòu)化病例數(shù)據(jù)信息,經(jīng)特征提取和特征數(shù)據(jù)標(biāo)準(zhǔn)化處理后,對得到的訓(xùn)練用數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí),通過訓(xùn)練得到鑒別肺癌模型。
所述的病例數(shù)據(jù)是指:根據(jù)醫(yī)學(xué)邏輯和已有文獻(xiàn)報(bào)導(dǎo),定義與肺癌風(fēng)險(xiǎn)相關(guān)的病例信息字段,主要涵蓋人口統(tǒng)計(jì)學(xué)信息、吸煙狀況、一般健康信息,呼吸系統(tǒng)疾病相關(guān)臨床信息;針對每個(gè)字段定義可能出現(xiàn)的情形,對分類型字段的內(nèi)容進(jìn)行賦值量化,建立數(shù)據(jù)字典。
所述的結(jié)構(gòu)化病例數(shù)據(jù)信息是指:收集經(jīng)篩查6年內(nèi)確診為肺癌和確診未患肺癌人群的病例,根據(jù)建立的數(shù)據(jù)字典轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)。
所述的肺結(jié)節(jié)良惡性評估模型,首先建立ct片中肺結(jié)節(jié)影像特征信息結(jié)構(gòu),收集確診為惡性的結(jié)節(jié)和確診為良性的結(jié)節(jié)的影像特征,經(jīng)特征提取和特征數(shù)據(jù)標(biāo)準(zhǔn)化處理后,對得到的訓(xùn)練用數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí),通過訓(xùn)練得到肺結(jié)節(jié)良惡性評估模型。
所述的肺結(jié)節(jié)影像特征信息結(jié)構(gòu)是指:根據(jù)醫(yī)學(xué)邏輯和已有文獻(xiàn)報(bào)導(dǎo),除收集第一部分中提及的信息外,定義結(jié)節(jié)形態(tài)的大小、位置、密度、形態(tài)字段;針對每個(gè)字段定義可能出現(xiàn)的情形,對分類型字段的內(nèi)容進(jìn)行賦值量化,建立數(shù)據(jù)字典。
所述的影響特征包括:經(jīng)確診為惡性的結(jié)節(jié)和確診為良性的ct影像結(jié)果和相關(guān)病人的病歷信息,根據(jù)建立的數(shù)據(jù)字典轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)。
所述的特征提取是指:針對結(jié)構(gòu)化病例數(shù)據(jù)中的每一個(gè)特征進(jìn)行數(shù)學(xué)分析和文獻(xiàn)挖掘,選取有潛在臨床意義的特征變量。
所述的訓(xùn)練用數(shù)據(jù)集是指:按正負(fù)樣本數(shù)目基本一致的原則隨機(jī)抽取樣本得到。
所述的訓(xùn)練是指:使用支持向量機(jī)算法對上面的特征進(jìn)行機(jī)器學(xué)習(xí),用剩余數(shù)據(jù)檢測預(yù)測效能,進(jìn)行參數(shù)調(diào)優(yōu),再次進(jìn)行機(jī)器學(xué)習(xí)和效能分析,直至獲得最優(yōu)模型。
本實(shí)施例通過如圖2所示的系統(tǒng)得以實(shí)現(xiàn):
在圖2所示肺癌高低危人群評估實(shí)施例中,通過填寫、下拉菜單、點(diǎn)擊選擇或者滑塊方式輸入用戶自己的基本信息、基本健康信息、一般生活狀態(tài)、目前的呼吸系統(tǒng)癥狀、慢性病與肺病史和吸煙狀態(tài)等,有無結(jié)節(jié)一欄選擇“否”滑塊,輸入完畢后點(diǎn)擊“評估”按鈕。在結(jié)果中展示用戶輸入的信息生成信息小結(jié),以彩虹圖和數(shù)字展示的方式給出患癌風(fēng)險(xiǎn)值,以雷達(dá)圖方式顯示各風(fēng)險(xiǎn)因素所占的比重。
在圖3所示肺結(jié)節(jié)良惡性評估實(shí)施例中,按圖2實(shí)施例中相同的方式輸入用戶自己的基本信息、基本健康信息、一般生活狀態(tài)、目前的呼吸系統(tǒng)癥狀、慢性病與肺病史和吸煙狀態(tài)等,在有無結(jié)節(jié)一欄選擇“是”滑塊,填寫結(jié)節(jié)大小、類型、位置、性質(zhì)等性狀。輸入完畢后點(diǎn)擊“評估”按鈕。在結(jié)果中以彩虹圖和數(shù)字展示的方式給出患癌風(fēng)險(xiǎn)值,以雷達(dá)圖方式顯示各風(fēng)險(xiǎn)因素所占的比重。此外,還以彩虹圖和數(shù)字展示的方式給出結(jié)節(jié)的惡性概率,以雷達(dá)圖方式顯示各風(fēng)險(xiǎn)因素所占的比重。此外還提供相關(guān)的科普信息。
上述具體實(shí)施可由本領(lǐng)域技術(shù)人員在不背離本發(fā)明原理和宗旨的前提下以不同的方式對其進(jìn)行局部調(diào)整,本發(fā)明的保護(hù)范圍以權(quán)利要求書為準(zhǔn)且不由上述具體實(shí)施所限,在其范圍內(nèi)的各個(gè)實(shí)現(xiàn)方案均受本發(fā)明之約束。