亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

心腦血管患者相似性分析方法及系統(tǒng)與流程

文檔序號:12467352閱讀:683來源:國知局
心腦血管患者相似性分析方法及系統(tǒng)與流程

本發(fā)明涉及一種智慧醫(yī)療領(lǐng)域,具體地,涉及一種心腦血管患者相似性分析方法及系統(tǒng)。



背景技術(shù):

隨著社會(huì)的發(fā)展,心腦血管疾病的發(fā)病率逐年上升。在我國,心腦血管疾病已成為當(dāng)今嚴(yán)重危害中老年人生命與健康的主要公共衛(wèi)生問題,其發(fā)病率、病死率、致殘率較高。根據(jù)統(tǒng)計(jì),中國每年發(fā)生腦中風(fēng)病人達(dá)200萬,致殘率高達(dá)75%,約3/4的患者有不同程度勞動(dòng)喪失,生活需要照顧,給患者、家庭、社會(huì)帶來沉重的負(fù)擔(dān)。

隨著康復(fù)醫(yī)學(xué)在我國得到迅速發(fā)展,心腦血管患者的病死率顯著降低,但致殘率仍非常高。今后臨床治療模式將越來越呈現(xiàn)個(gè)性化、精確化,精準(zhǔn)康復(fù)將是今后康復(fù)醫(yī)學(xué)發(fā)展方向。目前的康復(fù)治療沒有從臨床的角度根據(jù)病因、生理體征、生活習(xí)慣、生活環(huán)境等影響因子對患者群體進(jìn)行基于相似性的有效分組,因此也就無法對患者進(jìn)行個(gè)性化的康復(fù)治療,大大影響了患者的康復(fù)效果和滿意度。

隨著醫(yī)療信息化的發(fā)展,醫(yī)院也積累了大量的數(shù)據(jù)。如何更好的利用數(shù)據(jù)以及醫(yī)學(xué)知識,通過認(rèn)知計(jì)算技術(shù),提供精準(zhǔn)醫(yī)療的決策是心腦血管疾病臨床治療階段所需要的。本發(fā)明的主要目標(biāo)就是基于歷史數(shù)據(jù)將腦卒中康復(fù)患者細(xì)化分群,為特定患者找到患情最相似的一群其他患者,從而基于相似患者的診療實(shí)踐提取和挖據(jù)診療證據(jù),為目標(biāo)個(gè)體患者的個(gè)性化的康復(fù)治療項(xiàng)目。

到目前為止,基于認(rèn)知計(jì)算技術(shù)的中國人群心腦血管疾病相似性分析方面尚屬空白。而國內(nèi)外認(rèn)知計(jì)算技術(shù)在心腦血管疾病中的應(yīng)用主要集中在發(fā)病風(fēng)險(xiǎn)預(yù)測及診斷方面,在心腦血管患者相似性分析方面還尚未見有報(bào)道。鑒于國內(nèi)外沒有可用于心腦血管患者相似性分析的智能模型,很有必要建立一種面向臨床醫(yī)生的心腦血管患者相似性分析模型。



技術(shù)實(shí)現(xiàn)要素:

針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種心腦血管患者相似性分析方法及系統(tǒng),其建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對中國人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對不同的風(fēng)險(xiǎn)人群進(jìn)行有針對性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

根據(jù)本發(fā)明的一個(gè)方面,提供一種心腦血管患者相似性分析方法,其特征在于,其包括以下步驟:

步驟一,問題定義,基于歷史數(shù)據(jù)對心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對特定人群治療結(jié)局的影響,并針對個(gè)體患者推薦個(gè)性化治療方案,將幫助臨床醫(yī)生更精準(zhǔn)地認(rèn)識目標(biāo)患者的病情以及治療手段所帶來的預(yù)后效果,從而有效地實(shí)現(xiàn)個(gè)性化精準(zhǔn)醫(yī)療;

步驟二,數(shù)據(jù)采集,針對目標(biāo)人群,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù),所采集的數(shù)據(jù)包括:康復(fù)科門診數(shù)據(jù)、康復(fù)科治療室數(shù)據(jù)、神內(nèi)/神外門診數(shù)據(jù)、神內(nèi)/神外住院數(shù)據(jù)、康復(fù)科住院數(shù)據(jù)、腦卒中篩查門診數(shù)據(jù),這些數(shù)據(jù)涉及的內(nèi)容涵蓋有患者基本信息、病歷或電子病歷、檢測檢驗(yàn)、影像、診斷、處方、治療、評估表數(shù)據(jù);

步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)、日期時(shí)間、數(shù)值型、字符型以及是否型數(shù)據(jù),針對不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對性數(shù)據(jù)預(yù)處理;

步驟四,特征工程,患者數(shù)據(jù)來自多個(gè)臨床數(shù)據(jù)庫,涉及患者個(gè)體生理信息、歷史診療信息、病情信息,在使用機(jī)器學(xué)習(xí)技術(shù)建模學(xué)習(xí)數(shù)據(jù)之前,首先需要使用特定領(lǐng)域知識以及統(tǒng)計(jì)學(xué)習(xí)方法來提取或組合變化得到的各屬性數(shù)據(jù),從而生成有效的特征數(shù)據(jù);

步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模,其中通過夾角余弦來度量患者之間的相似性;

步驟六,診療方案推薦,當(dāng)患者問診時(shí),結(jié)合問診患者的個(gè)體特征和病患群體特征,采用基于相似性計(jì)算的群組定向技術(shù),為問診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問診患者。

優(yōu)選地,所述步驟三具體包括以下步驟:

步驟三十一,數(shù)據(jù)集成,把不同來源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號把不同數(shù)據(jù)源但是有同樣ID號的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

步驟三十二,數(shù)據(jù)清洗,針對不同數(shù)據(jù)類型存在的不同問題,提出了基于規(guī)則的數(shù)據(jù)清洗方法;

步驟三十三,缺失值處理,醫(yī)療領(lǐng)域的特征數(shù)據(jù)普遍在時(shí)間序列上比較稀疏,因此采用基于正則化最大期望算法進(jìn)行缺失數(shù)據(jù)的填補(bǔ),將缺失特征變量視為無法觀測的隱藏變量,此方法一般分為三步:一,計(jì)算最大期望;二,正則化EM,避免過度擬合;三,對上一步生成的方程進(jìn)行評估;

步驟三十四,特征刪除,根據(jù)專家知識對那些無效值和缺失值超過總樣本量30%的,對于診斷問題不是特別重要的特征進(jìn)行刪除處理;

步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測方法,結(jié)合常識性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識別,并對異常點(diǎn)進(jìn)行刪除處理。

優(yōu)選地,所述步驟四具體包括以下步驟:

步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過特征構(gòu)造和特征選擇技術(shù)識別潛在的風(fēng)險(xiǎn)因子;

步驟四十二,特征處理,使用log映射函數(shù)將特征取值映射到[0,1]區(qū)間,同時(shí)采用等值劃分方法對連續(xù)數(shù)據(jù)的離散化處理,將特征空間按照值域進(jìn)行均分,每一段內(nèi)的取值等同處理。

本發(fā)明還提供一種心腦血管患者相似性分析系統(tǒng),其特征在于,其包括:

問題定義模塊,基于歷史數(shù)據(jù)對心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對特定人群治療結(jié)局的影響,并針對個(gè)體患者推薦個(gè)性化治療方案;

數(shù)據(jù)采集模塊,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù);

數(shù)據(jù)預(yù)處理模塊,針對不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對性數(shù)據(jù)預(yù)處理;

特征工程生成模塊,生成有效的特征數(shù)據(jù);

患者聚類建模模塊,采用基于劃分的聚類算法,即k-均值算法進(jìn)行患者的聚類建模;

診療方案推薦模塊,采用基于相似性計(jì)算的群組定向技術(shù),為問診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問診患者;

數(shù)據(jù)庫,存儲數(shù)據(jù)采集模塊采集的數(shù)據(jù)以及診療方案推薦模塊的治療方案。

優(yōu)選地,所述問題定義模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、特征工程生成模塊、患者聚類建模模塊、診療方案推薦模塊依次連接,數(shù)據(jù)庫與數(shù)據(jù)采集模塊連接。

與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:本發(fā)明建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對中國人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對不同的風(fēng)險(xiǎn)人群進(jìn)行有針對性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

附圖說明

通過閱讀參照以下附圖對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:

圖1為本發(fā)明心腦血管疾病相似性分析方法的流程圖。

圖2為特征選擇的一般過程的流程圖。

圖3為本發(fā)明心腦血管疾病相似性分析系統(tǒng)的原理框圖。

具體實(shí)施方式

下面結(jié)合具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)說明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。

如圖1所示,本發(fā)明心腦血管患者相似性分析方法包括以下步驟:

步驟一,問題定義,基于歷史數(shù)據(jù)對心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對特定人群治療結(jié)局的影響,并針對個(gè)體患者推薦個(gè)性化治療方案,將幫助臨床醫(yī)生更精準(zhǔn)地認(rèn)識目標(biāo)患者的病情以及可能的治療手段所帶來的預(yù)后效果,從而有效地實(shí)現(xiàn)個(gè)性化精準(zhǔn)醫(yī)療;

步驟二,數(shù)據(jù)采集,針對目標(biāo)人群,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù),所采集的數(shù)據(jù)包括:康復(fù)科門診數(shù)據(jù)、康復(fù)科治療室數(shù)據(jù)、神內(nèi)/神外門診數(shù)據(jù)、神內(nèi)/神外住院數(shù)據(jù)、康復(fù)科住院數(shù)據(jù)、腦卒中篩查門診數(shù)據(jù),這些數(shù)據(jù)涉及的內(nèi)容涵蓋有患者基本信息、病歷或EMR(電子病歷)、檢測檢驗(yàn)、影像、診斷、處方、治療、評估表等數(shù)據(jù);

步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)(比如性別為男/女)、日期時(shí)間、數(shù)值型(比如檢測值)、字符型(比如診斷)以及是否型數(shù)據(jù),針對不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對性數(shù)據(jù)預(yù)處理,具體處理過程如下:

步驟三十一,數(shù)據(jù)集成,把不同來源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號把不同數(shù)據(jù)源但是有同樣ID號的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

步驟三十二,數(shù)據(jù)清洗,針對不同數(shù)據(jù)類型存在的不同問題,提出了基于規(guī)則的數(shù)據(jù)清洗方法;

步驟三十三,缺失值處理,醫(yī)療領(lǐng)域的特征數(shù)據(jù)普遍在時(shí)間序列上比較稀疏,因此采用基于正則化最大期望算法進(jìn)行缺失數(shù)據(jù)的填補(bǔ),將缺失特征變量視為無法觀測的隱藏變量,此方法一般可以分為三步:1)計(jì)算最大期望;2)正則化EM(最大期望),避免過度擬合;3)對上一步生成的方程進(jìn)行評估;

步驟三十四,特征刪除,根據(jù)專家知識對那些無效值和缺失值超過總樣本量30%的,對于診斷問題不是特別重要的特征進(jìn)行刪除處理;

步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測方法,結(jié)合常識性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識別,并對異常點(diǎn)進(jìn)行刪除處理;

步驟四,特征工程,患者數(shù)據(jù)來自多個(gè)臨床數(shù)據(jù)庫,涉及患者個(gè)體生理信息、歷史診療信息、病情信息,在使用機(jī)器學(xué)習(xí)技術(shù)建模學(xué)習(xí)數(shù)據(jù)之前,首先需要使用特定領(lǐng)域知識以及統(tǒng)計(jì)學(xué)習(xí)方法來提取或組合變化得到的各屬性數(shù)據(jù),從而生成有效的特征數(shù)據(jù),具體處理過程如下:

步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過特征構(gòu)造(轉(zhuǎn)換原始特征并衍生組合特征)和特征選擇(從原始特征和組合特征中自動(dòng)選擇潛在的風(fēng)險(xiǎn)因素)技術(shù)識別潛在的風(fēng)險(xiǎn)因子;

步驟四十二,特征處理,使用log映射函數(shù)將特征取值映射到[0,1]區(qū)間,同時(shí)采用等值劃分方法對連續(xù)數(shù)據(jù)的離散化處理,將特征空間按照值域進(jìn)行均分,每一段內(nèi)的取值等同處理;

步驟五,基于相似性的患者聚類建模,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模,其中通過夾角余弦來度量患者之間的相似性;

步驟六,診療方案推薦,當(dāng)患者問診時(shí),結(jié)合問診患者的個(gè)體特征和病患群體特征,采用基于相似性計(jì)算的群組定向技術(shù),為問診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問診患者。

實(shí)施例

本實(shí)施例涉及一種心腦血管患者相似性分析方法。

本實(shí)施例以XXX醫(yī)院康復(fù)科所采集的700位有明確康復(fù)結(jié)局的腦卒中患者為樣本,樣本數(shù)據(jù)具體包括:患者的基本信息(性別、年齡、身高、體重、教育程度、婚姻狀態(tài)等),體征數(shù)據(jù)(血壓、心率),病史數(shù)據(jù)(門診及住院診斷、用藥史及治療歷史、檢查檢驗(yàn)歷史及相關(guān)影像數(shù)據(jù)),進(jìn)入康復(fù)科后的功能評估項(xiàng)目及康復(fù)治療后的評定結(jié)果。

步驟一,問題定義

基于腦卒中患者康復(fù)治療的既往數(shù)據(jù),首先將患者人群按照特定康復(fù)預(yù)后結(jié)局分為子群,每個(gè)子群內(nèi)患者應(yīng)具有相似的預(yù)后結(jié)局,從以下幾方面對相似性分析模型進(jìn)行定義:1)訓(xùn)練集合患者總數(shù);2)群族數(shù)目及不同群族中的患者標(biāo)識;3)分群元數(shù)據(jù)包括分群相似性度量,分群算法及參數(shù),數(shù)據(jù)變換矩陣等?;谙嗨菩苑治龅姆秩耗P停瑢?shí)現(xiàn)以下功能:1)針對特定患者,識別患情相似的患者群;2)發(fā)現(xiàn)并總結(jié)相似患者群的共性特征;3)根據(jù)相似患者為目標(biāo)患者推薦使用的康復(fù)治療方案。

步驟二,數(shù)據(jù)采集

首先使用病人ID號將不同數(shù)據(jù)源但是有同樣ID號的數(shù)據(jù)連接在一起,這樣所有來自不同數(shù)據(jù)源的數(shù)據(jù)就整合到了同一個(gè)數(shù)據(jù)文件中,

步驟三,數(shù)據(jù)預(yù)處理,所采集的數(shù)據(jù)類型多種多樣,包括:選擇項(xiàng)、日期時(shí)間、數(shù)值型、字符型以及是否型數(shù)據(jù),針對不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對性數(shù)據(jù)預(yù)處理;具體處理過程如下:

步驟三十一,數(shù)據(jù)集成,把不同來源的數(shù)據(jù)按照一定規(guī)則整合到一起,根據(jù)病人ID號把不同數(shù)據(jù)源但是有同樣ID號的信息連接在一起,這樣所有不同數(shù)據(jù)源的數(shù)據(jù)就整合到了一起;

步驟三十二,數(shù)據(jù)清洗,如圖2所示,以數(shù)值型數(shù)據(jù)的清洗過程為例,分別針對不同原始數(shù)據(jù)的特征,使用相應(yīng)的清洗規(guī)則清洗數(shù)據(jù),進(jìn)而得到清洗后整齊的數(shù)據(jù)。

步驟二十三,缺失值處理,將數(shù)據(jù)清洗后的數(shù)據(jù)集進(jìn)行最大期望的詳細(xì)計(jì)算方法如下:

1、EM(最大期望)算法步驟,最大期望算法經(jīng)過兩個(gè)步驟交替進(jìn)行計(jì)算,第一步是計(jì)算期望(E),利用對隱藏變量的現(xiàn)有估計(jì)值,計(jì)算其最大似然估計(jì)值;第二步是最大化(M),最大化在期望(E)步上求得的最大似然值來計(jì)算參數(shù)的值,最大化(M)步找到的參數(shù)估計(jì)值被用于下一個(gè)期望(E)步計(jì)算中,這個(gè)過程不斷交替進(jìn)行。

2、EM(最大期望)算法應(yīng)用,用于估計(jì)無法觀測的數(shù)據(jù),y表示能夠觀察到的不完整變量值,用x表示無法觀察到的變量值,在給定的觀察到的數(shù)據(jù)條件下未知數(shù)據(jù)的條件分布如下式(1):

其中,p表示概率密度函數(shù);x表示輸入特征變量;y表示輸出目標(biāo)變量;θ表示模型的未知參數(shù)。

3、處理效果評估,采用標(biāo)準(zhǔn)誤差(RMSE)對缺失值的填充效果進(jìn)行評估,RMSE(采用標(biāo)準(zhǔn)誤差)能夠很好地反映出所填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度,RMSE值越小,表示填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度越小,其精度越高,反之,RMSE(采用標(biāo)準(zhǔn)誤差)越大,表示填充數(shù)據(jù)和真實(shí)數(shù)據(jù)的偏離程度越大,RMSE(采用標(biāo)準(zhǔn)誤差)的數(shù)學(xué)表達(dá)式如下式(2):

其中,n為樣本數(shù);Xobs,i代表第i個(gè)觀測值;Xmodel,i代表Xobs,i的模型預(yù)測值。

本實(shí)施例中未發(fā)現(xiàn)滿足刪除條件的特征和異常值。

步驟三十四,特征刪除,根據(jù)專家知識對那些無效值和缺失值超過總樣本量30%的,對于診斷問題不是特別重要的特征進(jìn)行刪除處理;

步驟三十五,去異常點(diǎn),采用偏差分析、基于分布不合理性的異常檢測方法,結(jié)合常識性規(guī)則、業(yè)務(wù)特定規(guī)則進(jìn)行異常值的識別,并對異常點(diǎn)進(jìn)行刪除處理。

步驟四,特征工程,潛在風(fēng)險(xiǎn)因子識別

如圖2所示,采用基于集合運(yùn)算(count,mean,min,max,std.)和領(lǐng)域知識的方法構(gòu)造新特征,例如某個(gè)病人一天中可能有幾個(gè)血壓值,我們可以采用平均值,最大值或最小值最為血壓這個(gè)特征變量的最后值,另外,采用的特征選擇過程包括產(chǎn)生過程、評價(jià)函數(shù)、停止準(zhǔn)則、驗(yàn)證過程四個(gè)部分。

在產(chǎn)生過程中,采用基于啟發(fā)式搜索方法的序列前向選擇方法,假設(shè)特征子集X從空集開始,每次選擇一個(gè)特征加入特征子集,使得特征函數(shù)最優(yōu),即每次都選擇一個(gè)使得評價(jià)函數(shù)的取值達(dá)到最優(yōu)的特征加入,采用的評價(jià)函數(shù)是基于篩選器的方法,并且使用線性相關(guān)系數(shù)來衡量向量之間線性相關(guān)度,如下式(3):

其中,Xi表示第i個(gè)特征向量;Y表示目標(biāo)輸出向量;cov(Xi,Y)表示Xi和Y的協(xié)方差;var(Xi)和var(Y)分別表示Xi和Y的方差。

當(dāng)評價(jià)函數(shù)值達(dá)到停止準(zhǔn)則設(shè)定的閾值后停止搜索過程,最后在驗(yàn)證數(shù)據(jù)集上驗(yàn)證選出來的特征子集的有效性,最后,通過log函數(shù)歸一化映射函數(shù)將特征取值映射到[0,1]區(qū)間,然后通過等值劃分對連續(xù)特征進(jìn)行離散化處理。

步驟四十一,特征構(gòu)造和特征選擇,其基于預(yù)處理后的數(shù)據(jù),通過特征構(gòu)造(轉(zhuǎn)換原始特征并衍生組合特征)和特征選擇(從原始特征和組合特征中自動(dòng)選擇潛在的風(fēng)險(xiǎn)因素)技術(shù)識別潛在的風(fēng)險(xiǎn)因子;

步驟四十二,特征處理

假設(shè)n維空間內(nèi)兩點(diǎn)a(x11,x12,...,x1n)與b(x21,x22,...,x2n),計(jì)算公式如下式(4):

其中,x1k表示點(diǎn)a的第k個(gè)元素;x2k表示點(diǎn)b的第k個(gè)元素;θ表示兩點(diǎn)之間的夾角。

其中夾角余弦取值范圍為[-1,1]。夾角余弦越大表示兩個(gè)向量的夾角越小,夾角余弦越小表示兩向量的夾角越大。當(dāng)兩個(gè)向量的方向重合時(shí)夾角余弦取最大值1,當(dāng)兩個(gè)向量的方向完全相反夾角余弦取最小值-1。

步驟五,基于相似性的患者聚類建模

對由700位腦卒中患者特征向量組成的數(shù)據(jù)集,基于KNN聚類算法構(gòu)造六個(gè)分組,每一個(gè)分組就代表一個(gè)聚類,詳細(xì)聚類過程如下:

給定要構(gòu)建的群組數(shù),劃分方法首先創(chuàng)建一個(gè)初始化劃分;

通過把對象從一個(gè)組移動(dòng)到另一個(gè)組來進(jìn)行劃分,使同一個(gè)群組中的各對象盡可能相互接近或相關(guān),而不同的群組中的對象盡可能遠(yuǎn)離或不同;

反復(fù)迭代的方式更新分組,使得更新之后的分組方案都較前一次好,知道算法收斂。

步驟六,個(gè)性化診療方案推薦

采用基于相似性度量的KNN找到與目標(biāo)患者最相近的歷史患者群組,kNN算法的核心思想是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來決定待分樣本所屬的類別。

如圖3所示,本發(fā)明心腦血管患者相似性分析系統(tǒng)包括:

問題定義模塊,基于歷史數(shù)據(jù)對心腦血管患者進(jìn)行細(xì)化分群,研究特定治療手段對特定人群治療結(jié)局的影響,并針對個(gè)體患者推薦個(gè)性化治療方案;

數(shù)據(jù)采集模塊,從相關(guān)信息系統(tǒng)收集觀察期窗口內(nèi)的患者醫(yī)療健康數(shù)據(jù)及預(yù)后結(jié)局?jǐn)?shù)據(jù);

數(shù)據(jù)預(yù)處理模塊,針對不同數(shù)據(jù)類型需要采取不同處理方法進(jìn)行針對性數(shù)據(jù)預(yù)處理;

特征工程生成模塊,生成有效的特征數(shù)據(jù);

患者聚類建模模塊,采用基于劃分的聚類算法、k-均值算法進(jìn)行患者的聚類建模;

診療方案推薦模塊,采用基于相似性計(jì)算的群組定向技術(shù),為問診患者找到最相近歷史病患群組,抽取出該群組內(nèi)病患的主體診療方案作為首選診療方案推薦給問診患者;

數(shù)據(jù)庫,存儲數(shù)據(jù)采集模塊采集的數(shù)據(jù)以及診療方案推薦模塊的治療方案等。

問題定義模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、特征工程生成模塊、患者聚類建模模塊、診療方案推薦模塊依次連接,數(shù)據(jù)庫與數(shù)據(jù)采集模塊連接,這樣方便連接。

綜上所述,本發(fā)明建立有效地心腦血管患者相似性分析模型,臨床醫(yī)生通過患者特征就能得到給定患者的相似人群,然后推薦個(gè)性化治療方案,以達(dá)到精準(zhǔn)醫(yī)療的目的,能夠很好的對中國人群心腦血管疾病患者進(jìn)行基于相似性分析的人群分組,盡早針對不同的風(fēng)險(xiǎn)人群進(jìn)行有針對性的個(gè)性化康復(fù)治療,具有巨大的醫(yī)療和臨床使用價(jià)值。

以上對本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不局限于上述特定實(shí)施方式,本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改,這并不影響本發(fā)明的實(shí)質(zhì)內(nèi)容。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1