亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法與流程

文檔序號(hào):12669348閱讀:2103來(lái)源:國(guó)知局
一種基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法與流程

本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法。



背景技術(shù):

醫(yī)療保險(xiǎn)費(fèi)用支付計(jì)算是醫(yī)療保障體系的重要環(huán)節(jié),關(guān)系到醫(yī)療保險(xiǎn)各方利益。當(dāng)前醫(yī)療費(fèi)用的增長(zhǎng)速度快,為了防止醫(yī)療保險(xiǎn)入不敷出的情況,需要做醫(yī)保控費(fèi)。

傳統(tǒng)的醫(yī)保控費(fèi)的方式有總額預(yù)付和按項(xiàng)目付費(fèi)等方法。“按項(xiàng)目付費(fèi)”根據(jù)患者在醫(yī)院接受服務(wù)所花費(fèi)的費(fèi)用按收費(fèi)單據(jù)報(bào)銷。缺陷是無(wú)法約束醫(yī)院的醫(yī)療行為,容易造成服務(wù)過(guò)度,且醫(yī)院缺乏成本控制意識(shí),傾向引入尖端診療設(shè)備和推銷高價(jià)格藥物,導(dǎo)致費(fèi)用大幅度上升?!翱傤~預(yù)付制”是由醫(yī)保部門以前期醫(yī)院總支出為依據(jù)計(jì)算人均醫(yī)療費(fèi)用,按此費(fèi)用標(biāo)準(zhǔn)按年度撥付醫(yī)院費(fèi)用總額,如發(fā)生費(fèi)用超支,則由醫(yī)院承擔(dān)。雖然在總體上控制了醫(yī)療開支的過(guò)快增長(zhǎng),缺陷是容易造成了醫(yī)院的醫(yī)療浪費(fèi)和小病大治,導(dǎo)致醫(yī)療成本控制很難落實(shí)。

如何根據(jù)已知的疾病基礎(chǔ)數(shù)據(jù),運(yùn)用相關(guān)算法實(shí)現(xiàn)對(duì)疾病診斷的分類,從而為后期的醫(yī)保控費(fèi)等應(yīng)用打下基礎(chǔ),是當(dāng)前需要解決的技術(shù)問(wèn)題。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的旨在至少解決所述技術(shù)缺陷之一。

為此,本發(fā)明的目的在于提出一種基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法。

為了實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)施例提供一種基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法,包括:

步驟S1,獲取疾病種類的基礎(chǔ)數(shù)據(jù),將所述疾病種類的基礎(chǔ)數(shù)據(jù)按照人體解剖系統(tǒng)分為多個(gè)疾病診斷分組解剖大類;

步驟S2,根據(jù)預(yù)設(shè)的手術(shù)類型及操作的難易程度數(shù)據(jù),將每個(gè)疾病診斷分組解剖大類進(jìn)一步劃分為多個(gè)疾病診斷操作子類;

步驟S3,針對(duì)每個(gè)所述疾病診斷操作子類,設(shè)置因變量和自變量,運(yùn)用決策樹算法選取符合預(yù)設(shè)條件的因素,將病例樣本細(xì)分為診斷相關(guān)組,包括:利用所述決策樹算法對(duì)每個(gè)所述疾病診斷操作子類的變量值進(jìn)行切分,并分別計(jì)算切分前誤差平方和SSE1以及切分后誤差平方和SSE2,選取SSE2與SSE1差值的最大值對(duì)應(yīng)的變量屬性作為最佳切分選擇,重復(fù)上述步驟,直至按針對(duì)該變量特征劃分后節(jié)點(diǎn)各數(shù)值相同或達(dá)到規(guī)定的切分層數(shù),則停止算法迭代;

步驟S4,在決策樹選取的切分特征變量中,將切分后節(jié)點(diǎn)費(fèi)用均值低于預(yù)設(shè)閾值的并發(fā)癥確定為一般并發(fā)癥,將切分后節(jié)點(diǎn)均值費(fèi)用高于預(yù)設(shè)閾值的并發(fā)癥確定為重要并發(fā)癥,以此劃分診斷相關(guān)組。

進(jìn)一步,所述多個(gè)疾病診斷分組解剖大類,包括:神經(jīng)系統(tǒng)疾病組、消化系統(tǒng)疾病組、骨科系統(tǒng)疾病組。

進(jìn)一步,在所述步驟S3中,所述因變量為該疾病診斷操作子類對(duì)應(yīng)的治療總費(fèi)用,自變量為并發(fā)癥、患者年齡以及是否死亡,所述預(yù)設(shè)條件為影響治療費(fèi)用的因素。

進(jìn)一步,在所述步驟S3中,所述決策樹算法采用分類回歸決策樹算法。

進(jìn)一步,

其中,vi是變量Xi切分前的具體值,vi'是變量Xi切分后的具體值,i=1,2,…n。

進(jìn)一步,在所述步驟S4之后,還包括如下步驟:根據(jù)劃分的診斷相關(guān)組,進(jìn)行保險(xiǎn)支付、保險(xiǎn)欺詐異常識(shí)別、醫(yī)保控費(fèi)和醫(yī)療績(jī)效評(píng)價(jià)操作。

根據(jù)本發(fā)明實(shí)施例的基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法,以臨床病案數(shù)據(jù)為基礎(chǔ),通過(guò)劃分出疾病診斷分組解剖大類,進(jìn)而細(xì)分出疾病診斷操作子類,運(yùn)用醫(yī)學(xué)診斷與決策樹算法,將臨床過(guò)程相近、資源消耗相近的病例歸為一類,實(shí)現(xiàn)病例自動(dòng)化分組,為醫(yī)療保險(xiǎn)支付、醫(yī)療服務(wù)績(jī)效考核等提供支持,可以提高醫(yī)療資源管理的科學(xué)性、穩(wěn)定性和準(zhǔn)確性。

本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。

附圖說(shuō)明

本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:

圖1為根據(jù)本發(fā)明實(shí)施例的基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法的流程圖;

圖2為根據(jù)本發(fā)明實(shí)施例的形成診斷相關(guān)組的示意圖。

具體實(shí)施方式

下面詳細(xì)描述本發(fā)明的實(shí)施例,實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。

如圖1所示,本發(fā)明實(shí)施例的基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法,包括如下步驟:

步驟S1,獲取疾病種類的基礎(chǔ)數(shù)據(jù),將疾病種類的基礎(chǔ)數(shù)據(jù)按照人體解剖系統(tǒng)分為多個(gè)疾病診斷分組解剖大類。其中,疾病種類的基礎(chǔ)數(shù)據(jù)包括對(duì)疾病的診斷數(shù)據(jù),即根據(jù)疾病的主要診斷結(jié)果,將疾病按照人體的解剖系統(tǒng)分為26個(gè)大類。

在本發(fā)明的一個(gè)實(shí)施例中,多個(gè)疾病診斷分組解剖大類,包括:神經(jīng)系統(tǒng)疾病組、消化系統(tǒng)疾病組、骨科系統(tǒng)疾病組。需要說(shuō)明的是,疾病診斷分組解剖大類是根據(jù)人體解剖系統(tǒng)進(jìn)行劃分,除上述舉例外還包括其他類別,在此不再贅述。

步驟S2,根據(jù)預(yù)設(shè)的手術(shù)類型及操作的難易程度數(shù)據(jù),將每個(gè)疾病診斷分組解剖大類進(jìn)一步劃分為多個(gè)疾病診斷操作子類。

舉例來(lái)說(shuō),根據(jù)手術(shù)類型及操作的難易程度對(duì)骨科系統(tǒng)疾病進(jìn)行歸類,將大關(guān)節(jié)置換術(shù)、大關(guān)節(jié)翻修術(shù)、大關(guān)節(jié)除置換翻修以外手術(shù)、小關(guān)節(jié)置換翻修術(shù)、小關(guān)節(jié)除置換翻修以外術(shù)、脊柱融合手術(shù)、脊柱非融合手術(shù)、骨盆髖臼術(shù)、上肢長(zhǎng)骨術(shù)、下肢長(zhǎng)骨術(shù)、肌肉肌腱術(shù)、周圍神經(jīng)術(shù)、清創(chuàng)手術(shù)及其他骨及肌肉手術(shù)等劃分進(jìn)同一‘疾病診斷操作子類’中,以確保疾病分組符合醫(yī)學(xué)和臨床實(shí)踐。

步驟S3,針對(duì)每個(gè)疾病診斷操作子類,設(shè)置因變量和自變量,運(yùn)用決策樹算法選取符合預(yù)設(shè)條件的因素,將病例樣本細(xì)分為診斷相關(guān)組。

在本發(fā)明的一個(gè)實(shí)施例中,因變量為該疾病診斷操作子類對(duì)應(yīng)的治療總費(fèi)用,自變量為并發(fā)癥、患者年齡以及是否死亡,預(yù)設(shè)條件為影響治療費(fèi)用的因素。即,以治療總費(fèi)用作為因變量,并發(fā)癥、患者年齡以及是否死亡等作為自變量,運(yùn)用決策樹算法,遴選影響費(fèi)用的重要因素,將病例樣本進(jìn)一步細(xì)分為診斷相關(guān)組。

具體地,利用決策樹算法對(duì)每個(gè)疾病診斷操作子類的變量值進(jìn)行切分,對(duì)變量值的切分采用計(jì)算數(shù)值型因變量的平方誤差和(每條數(shù)據(jù)的值到均值的差值的平方的總和),分別計(jì)算切分前誤差平方和SSE1(Sum of Square Error)以及切分后誤差平方和SSE2,選取SSE2與SSE1差值的最大值對(duì)應(yīng)的變量屬性作為最佳切分選擇,重復(fù)上述步驟,直至按針對(duì)該變量特征劃分后節(jié)點(diǎn)各數(shù)值相同或達(dá)到規(guī)定的切分層數(shù),則停止算法迭代。

其中,vi是變量Xi切分前的具體值,vi'是變量Xi切分后的具體值,i=1,2,…n。

優(yōu)選的,根據(jù)變量數(shù)據(jù)類型,決策樹算法可以采用分類回歸決策樹算法(CART,Classification And Regression Trees)算法進(jìn)行特征提取。

步驟S4,在決策樹選取的切分特征變量中,將切分后節(jié)點(diǎn)費(fèi)用均值低于預(yù)設(shè)閾值的并發(fā)癥確定為一般并發(fā)癥,將切分后節(jié)點(diǎn)均值費(fèi)用高于預(yù)設(shè)閾值的并發(fā)癥確定為重要并發(fā)癥,以此劃分診斷相關(guān)組。

此外,在步驟S4之后,還包括如下步驟:根據(jù)劃分的診斷相關(guān)組,進(jìn)行保險(xiǎn)支付、保險(xiǎn)欺詐異常識(shí)別、醫(yī)??刭M(fèi)和醫(yī)療績(jī)效評(píng)價(jià)操作。

具體來(lái)說(shuō),疾病診斷分組結(jié)果可應(yīng)用于以下領(lǐng)域:

1.保險(xiǎn)支付:將住院患者數(shù)據(jù)按照診斷劃分不同疾病診斷組,對(duì)每個(gè)組分別定價(jià),醫(yī)療保險(xiǎn)機(jī)構(gòu)在診療全過(guò)程中一次性向醫(yī)院支付醫(yī)療費(fèi)用。

2.保險(xiǎn)欺詐異常識(shí)別:通過(guò)分析相似病案消耗醫(yī)療資源情況,排查異常病例,識(shí)別高風(fēng)險(xiǎn)醫(yī)保欺詐行為。

3.醫(yī)??刭M(fèi):政府醫(yī)保部門根據(jù)疾病診斷組費(fèi)用,研究確定各地區(qū)基本醫(yī)療保險(xiǎn)總額預(yù)付。

4.醫(yī)療績(jī)效評(píng)價(jià):通過(guò)病案數(shù)據(jù)實(shí)現(xiàn)病例分類,從產(chǎn)能、效率、安全性等維度對(duì)醫(yī)療行為進(jìn)行績(jī)效評(píng)估,提高醫(yī)療服務(wù)效率。

下面結(jié)合具體實(shí)施例對(duì)本發(fā)明的基于決策樹算法的疾病診斷分組進(jìn)行說(shuō)明。表1示出了疾病診斷的基礎(chǔ)數(shù)據(jù)。

表1

(1)解剖系統(tǒng)分類:依據(jù)主要診斷,以下病例樣本解剖系統(tǒng)類別為循環(huán)系統(tǒng)疾病。設(shè)置分組代碼為B。

(2)操作分類:依據(jù)病例主要診斷和手術(shù)操作,將樣本細(xì)分為兩個(gè)疾病診斷操作類:經(jīng)皮心血管操作及冠狀動(dòng)脈藥物洗脫支架植入組(病案號(hào):1、2、3),設(shè)置分組代碼為BB1;經(jīng)皮心血管操作及冠狀動(dòng)脈非藥物洗脫支架植入組(病案號(hào):4、5),設(shè)置分組代碼為BB2。

(3)利用決策樹算法劃分診斷相關(guān)組

(3.1)選擇切分變量和特征值

對(duì)BB1組切分過(guò)程中,計(jì)算每個(gè)變量的每個(gè)特征值切分前、后總誤差平方和,選取“年齡17歲”作為最佳切分特征值,切分后,小于等于17歲的病例組成左側(cè)樹,大于17歲的病例組成右側(cè)樹。

(3.2)算法迭代

對(duì)左側(cè)樹建立決策樹模型,選取并發(fā)癥作為最佳切分變量,費(fèi)用均值較低的一組為一般并發(fā)癥,費(fèi)用均值較高的一組為重要并發(fā)癥。

(3.3)算法停止條件

如某個(gè)節(jié)點(diǎn)所有費(fèi)用值相等、節(jié)點(diǎn)數(shù)據(jù)集很小,或誤差減少不大,則算法在該節(jié)點(diǎn)停止迭代。

(3.4)形成“診斷相關(guān)組”

參考圖2,根據(jù)決策樹模型將病例數(shù)據(jù)集劃分為3組:BB14(年齡小于17歲,伴有一般并發(fā)癥)、BB12(年齡小于17歲,伴有重要并發(fā)癥)、BB19(年齡大于17歲)。計(jì)算各組病例平均費(fèi)用,BB14組平均費(fèi)用為124567.9元,BB12組平均費(fèi)用為174448.6元,BB19平均費(fèi)用為280663.4元,可作為預(yù)測(cè)醫(yī)療服務(wù)費(fèi)用參考值。

所有可能的分組結(jié)果如表2所示:

表2

根據(jù)本發(fā)明實(shí)施例的基于決策樹算法的疾病診斷分組的實(shí)現(xiàn)方法,以臨床病案數(shù)據(jù)為基礎(chǔ),通過(guò)劃分出疾病診斷分組解剖大類,進(jìn)而細(xì)分出疾病診斷操作子類,運(yùn)用醫(yī)學(xué)診斷與決策樹算法,將臨床過(guò)程相近、資源消耗相近的病例歸為一類,實(shí)現(xiàn)病例自動(dòng)化分組,為醫(yī)療保險(xiǎn)支付、醫(yī)療服務(wù)績(jī)效考核等提供支持,可以提高醫(yī)療資源管理的科學(xué)性、穩(wěn)定性和準(zhǔn)確性。

在本說(shuō)明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。

盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的原理和宗旨的情況下在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。本發(fā)明的范圍由所附權(quán)利要求及其等同限定。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1