本發(fā)明涉及數(shù)據(jù)識別,尤其涉及一種醫(yī)院信息科用醫(yī)療信息卡數(shù)據(jù)識別系統(tǒng)。
背景技術:
1、在當今社會,幾乎所有醫(yī)院都已配備了his、lis、pacs、cis等信息系統(tǒng);這些系統(tǒng)涵蓋了從患者掛號、住院到檢查、用藥等各個環(huán)節(jié),甚至擴展到衛(wèi)生管理和科研教學領域,實現(xiàn)了醫(yī)院各類醫(yī)療與管理業(yè)務的初步信息化和數(shù)字化;由此,患者在診療過程中生成的所有數(shù)據(jù)均被記錄和流通于這些系統(tǒng)中;這些數(shù)據(jù)不僅反映了患者的健康狀況與疾病表現(xiàn),也為醫(yī)生提供了循證依據(jù)和決策支持;可以說,數(shù)據(jù)已經(jīng)成為現(xiàn)代醫(yī)療實踐中不可或缺的核心要素,而醫(yī)院信息科則負責對此類數(shù)據(jù)的處理。
2、患者在醫(yī)院就診時,一般會歷經(jīng)多個流程,包括掛號、檢查、診斷、治療、住院和結算等,而這些階段在醫(yī)院的信息管理過程中,對醫(yī)療信息卡數(shù)據(jù)的需求、處理要求各不相同,例如掛號時需求點在于患者身份和醫(yī)保信息,而在診斷和治療階段,則主要在于患者的詳細病史、藥物過敏史和診療方案;同時醫(yī)院信息科所處理數(shù)據(jù)來自多個不同的系統(tǒng),包括醫(yī)保系統(tǒng)、電子病歷系統(tǒng)emr、實驗室信息管理系統(tǒng)lis等,不同系統(tǒng)數(shù)據(jù)格式、標準和內(nèi)容存在差異,導致信息卡數(shù)據(jù)識別時容易出現(xiàn)不一致的問題。
3、目前的醫(yī)療信息卡數(shù)據(jù)識別方法采用單一識別方式,如基于模板匹配的ocr模型、基于規(guī)則引擎的識別系統(tǒng)等,對所有階段使用相同的處理邏輯,這種識別方法缺乏針對性,無法有效區(qū)分不同階段的數(shù)據(jù)需求,導致信息識別的準確性和效率不足,如在診斷階段,患者的病史與之前掛號信息無關,此階段只需要對患者的病史進行處理,掛號信息不需要額外處理信息只要有效關聯(lián)即可,但現(xiàn)有的統(tǒng)一處理方式將所有信息均進行處理,部分信息在前后階段中重復出現(xiàn)且無關緊要,無法有效過濾和優(yōu)先處理重要數(shù)據(jù),會導致數(shù)據(jù)冗余或干擾;而針對醫(yī)院信息科不同數(shù)據(jù)的處理過程,缺乏跨系統(tǒng)的數(shù)據(jù)一致性校驗機制,各系統(tǒng)間數(shù)據(jù)不能有效整合,導致信息不一致,具體來說,如果患者在醫(yī)保系統(tǒng)中的身份信息與電子病歷中的信息不完全匹配,則會導致識別錯誤或數(shù)據(jù)丟失,而現(xiàn)有方案太過依賴人工數(shù)據(jù)校驗,效率低下且容易出錯。
技術實現(xiàn)思路
1、為此,本發(fā)明提供一種醫(yī)院信息科用醫(yī)療信息卡數(shù)據(jù)識別系統(tǒng),用以克服現(xiàn)有技術中患者就診過程中的不同階段對醫(yī)療信息卡數(shù)據(jù)的需求、處理要求各不相同,單一識別方式缺乏針對性,無法有效區(qū)分不同階段的數(shù)據(jù)需求;同時醫(yī)院信息科所處理數(shù)據(jù)來自多個不同的系統(tǒng),缺乏跨系統(tǒng)的數(shù)據(jù)一致性校驗機制,各系統(tǒng)間數(shù)據(jù)不能有效整合,易導致信息不一致的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供一種醫(yī)院信息科用醫(yī)療信息卡數(shù)據(jù)識別系統(tǒng),包括:
3、動態(tài)路徑跟蹤模塊,實時集成醫(yī)院信息系統(tǒng)his數(shù)據(jù)流,動態(tài)跟蹤患者的醫(yī)療路徑;識別并輸出患者當前所處的醫(yī)療階段信息,包括掛號、診斷、檢查、治療、結算;
4、階段性識別模塊,基于動態(tài)路徑跟蹤模塊輸出的當前階段信息,自動加載與該階段對應的識別邏輯和算法;在每個醫(yī)療階段,優(yōu)先處理與當前階段需求密切相關的數(shù)據(jù);例如,在掛號階段,處理患者身份和醫(yī)保信息;在診斷階段,處理病史、診斷結果和藥物信息,輸出階段性數(shù)據(jù)識別結果;
5、實時調(diào)整模塊,當動態(tài)路徑跟蹤模塊監(jiān)測到患者的醫(yī)療階段變化時,實時調(diào)整識別邏輯,卸載已完成階段的識別模塊,加載對應新階段的數(shù)據(jù)處理規(guī)則,使系統(tǒng)始終針對當前階段優(yōu)化數(shù)據(jù)處理;實時調(diào)整模塊與電子病歷系統(tǒng)emr聯(lián)動,獲取實時反饋,進一步優(yōu)化識別模塊的精準度;
6、實時調(diào)整模塊輸出調(diào)整后的識別邏輯與識別結果,使系統(tǒng)在分階段的就診過程識別效果更好;
7、多源數(shù)據(jù)匯聚模塊,從不同的源系統(tǒng)匯聚患者相關數(shù)據(jù),對匯聚的數(shù)據(jù)進行標準化處理和數(shù)據(jù)清洗,統(tǒng)一數(shù)據(jù)格式和編碼標準;
8、異常檢測模塊,基于多源數(shù)據(jù)匯聚模塊提供的數(shù)據(jù),進行實時一致性校驗。
9、進一步地,動態(tài)路徑跟蹤模塊中,實時跟蹤方式為:
10、進行數(shù)據(jù)流時間序列建模,從醫(yī)院信息系統(tǒng)獲取的患者醫(yī)療活動數(shù)據(jù)并視為一個時間序列s(t),其中t為時間戳,表示數(shù)據(jù)流的時間點,s(t)={a1(t),a2(t),...,an(t)},s(t)代表在時間t上的所有醫(yī)療活動,ai(t)表示第i個醫(yī)療活動的狀態(tài)向量,i指代式中的1,2,...,n;
11、ai(t)表示為:ai(t)={idi,ti,pi,ci,li},其中idi表示患者的唯一標識符,ti表示醫(yī)療活動的類型(如掛號、診斷、檢查等),pi表示醫(yī)療活動的相關參與人員(如醫(yī)生、護士),ci表示醫(yī)療活動的具體內(nèi)容(如診斷結果、治療建議),li表示醫(yī)療活動的發(fā)生地點(如科室、病房);
12、為識別患者所處的醫(yī)療階段,定義動態(tài)狀態(tài)轉(zhuǎn)移矩陣m(t),描述患者在不同時間點從一個醫(yī)療活動過渡到另一個的概率,設矩陣m(t)的元素mij(t)表示從醫(yī)療活動i過渡到醫(yī)療活動j的轉(zhuǎn)移概率:
13、其中mij(t)表示在時間t上,患者從活動i轉(zhuǎn)移到活動j的概率,定義為:count(ai→aj)表示從活動i到活動j的實際轉(zhuǎn)移次數(shù),表示患者從活動i轉(zhuǎn)移到所有可能的目標活動k總次數(shù),k表示所有可能的目標活動,n表示總的醫(yī)療活動種類數(shù);
14、通過狀態(tài)轉(zhuǎn)移矩陣m(t)和當前的醫(yī)療活動狀態(tài)s(t),使用馬爾可夫鏈預測下一步可能的醫(yī)療階段,并識別當前階段c(t),對于當前時間點t,患者的階段預測為:
15、其中p(ai(t))表示在時間t觀察到活動ai(t)的概率,c(t)表示預測的最可能醫(yī)療階段,對應當前患者所處的階段。
16、進一步地,階段性識別模塊中,根據(jù)實時跟蹤輸出的當前醫(yī)療階段信息,加載與當前階段匹配的識別邏輯:
17、定義自適應加載函數(shù)l(ct),l(ct)包含m1,m2,...,m5不同醫(yī)療階段識別模塊,m1,m2,...,m5對應當前識別的醫(yī)療階段c(t)加載的相應識別模塊,包括掛號、診斷、檢查、治療以及結算;
18、基于歷史數(shù)據(jù)反饋,定義動態(tài)優(yōu)化函數(shù)o(t),o(t)在每次加載模塊時進行性能優(yōu)化:
19、其中w(t)是時間加權矩陣,賦予更近時間點的數(shù)據(jù)更高權重,e(t,θ)是誤差矩陣,反映當前模塊性能與實際需求的偏差,通過調(diào)整參數(shù)θ最小化該偏差,t0表示模塊性能優(yōu)化開始的時間點。
20、進一步地,實時調(diào)整模塊與電子病歷系統(tǒng)emr以及其他相關系統(tǒng)聯(lián)動,實時獲取系統(tǒng)反饋,動態(tài)調(diào)整識別邏輯:
21、定義反饋接收函數(shù)為f(t),用于從電子病歷系統(tǒng)emr和其他系統(tǒng)接收反饋信號:
22、f(t)={f1(t),f2(t),...,fm(t)},其中fi(t)表示來自第i個反饋源(如emr)的重要性,i指代式中1,2,...m,
23、m表示反饋源數(shù)量;
24、根據(jù)反饋信號,定義動態(tài)調(diào)整函數(shù)d(t),實時更新識別邏輯:
25、其中αi是反饋信號的權重,表示不同反饋源的重要性,▽θo(t)表示相對于參數(shù)θ的梯度,指導如何調(diào)整識別邏輯以最優(yōu)地適應當前醫(yī)療階段;
26、從而有效集成his數(shù)據(jù)流,實時識別和預測患者的醫(yī)療階段,并動態(tài)加載與當前階段匹配的識別邏輯。
27、進一步地,源系統(tǒng)包括醫(yī)保系統(tǒng)、電子病歷系統(tǒng)emr、實驗室信息管理系統(tǒng)lis;
28、多源數(shù)據(jù)匯聚模塊輸出標準化的多源數(shù)據(jù)。
29、進一步地,多源數(shù)據(jù)匯聚模塊中,進行標準化處理方式為:
30、對于每個源系統(tǒng)si,提取時間序列數(shù)據(jù)流di(t),其中i表示系統(tǒng)的索引,定義為:
31、di(t)={di1(t),di2(t),...,dim(t)},其中t為時間戳,表示數(shù)據(jù)提取的時間點,dij(t)表示在時間t從系統(tǒng)si中提取的第j條數(shù)據(jù)記錄,j指代式中1,2,...,m;
32、將不同系統(tǒng)中的數(shù)據(jù)映射到通用數(shù)據(jù)表示格式mi(t),映射函數(shù)定義為φi:
33、mi(t)=φi(di(t)),φi表示從源系統(tǒng)數(shù)據(jù)格式到通用格式的映射函數(shù);
34、對匯聚的數(shù)據(jù)進行標準化處理,定義標準化函數(shù)σi將各系統(tǒng)的數(shù)據(jù)格式轉(zhuǎn)換為統(tǒng)一格式f(t):
35、f(t)=σi(mi(t)),其中σi表示格式標準化函數(shù),用于轉(zhuǎn)換不同系統(tǒng)的數(shù)據(jù)格式到統(tǒng)一的標準格式f(t),f(t)表示標準化后的數(shù)據(jù)格式,統(tǒng)一表示為f(t)={f1(t),f2(t),...,fm(t)};
36、使用編碼標準化矩陣ci對每個源系統(tǒng)的數(shù)據(jù)編碼進行標準化:
37、ei(t)=ci·f(t),其中ci表示編碼標準化矩陣,將不同系統(tǒng)的編碼映射到統(tǒng)一的編碼標準,ei(t)表示標準化后的編碼數(shù)據(jù),表示為ei(t)={ei1(t),ei2(t),...,eim(t)};
38、采用語義標準化函數(shù)ψ對數(shù)據(jù)的語義進行統(tǒng)一處理:
39、s(t)=ψ(ei(t)),其中ψ表示語義標準化函數(shù),將不同系統(tǒng)中的語義標準化為統(tǒng)一的語義表示,s(t)表示標準化后的語義數(shù)據(jù),表示為s(t)={s1(t),s2(t),...,sm(t)}。
40、進一步地,多源數(shù)據(jù)匯聚模塊中,進行數(shù)據(jù)清洗方式為:
41、使用數(shù)據(jù)清洗函數(shù)去除冗余數(shù)據(jù)和不一致數(shù)據(jù),將s'(t)定義為清洗后的數(shù)據(jù)集;
42、定義檢查函數(shù)為一致性檢查函數(shù)χ,采用χ對數(shù)據(jù)的一致性進行校驗,表示為χ(s'(t)),輸出結果返回布爾值,檢查數(shù)據(jù)是否一致,若不一致,自動觸發(fā)修正機制或向管理員發(fā)送警報。
43、進一步地,異常檢測模塊中一致性校驗方式為:
44、在識別醫(yī)療信息卡數(shù)據(jù)時,自動與不同系統(tǒng)的數(shù)據(jù)進行比對;
45、發(fā)現(xiàn)跨系統(tǒng)數(shù)據(jù)不一致時,觸發(fā)異常檢測,標記問題數(shù)據(jù),并向信息科工作人員發(fā)出警報;
46、異常檢測模塊根據(jù)歷史數(shù)據(jù)和規(guī)則庫,自動修正錯誤。
47、進一步地,異常檢測模塊中,當檢測到數(shù)據(jù)不一致時自動觸發(fā)修正機制:
48、異常檢測模塊對所有檢測到的不一致數(shù)據(jù)進行標記,記錄下每條數(shù)據(jù)的不一致類型,包括標記哪些數(shù)據(jù)的編碼格式不匹配,哪些數(shù)據(jù)的語義不一致,哪些數(shù)據(jù)格式不正確;
49、根據(jù)標記分類不一致數(shù)據(jù),并為每條數(shù)據(jù)分配一個具體的不一致類型;
50、每種不一致類型對應不同修正策略,針對編碼不一致,進行重新編碼或格式轉(zhuǎn)換;針對語義不一致,進行重新解釋或人工審查;
51、對于每一條不一致的數(shù)據(jù)根據(jù)其類型從策略庫中選擇對應修正策略;通過評估不同策略的效果,自動選擇修復該數(shù)據(jù)的策略。
52、進一步地,數(shù)據(jù)識別系統(tǒng)工作流程包括:
53、步驟s1,啟動,動態(tài)路徑跟蹤模塊識別患者當前醫(yī)療階段,輸出階段信息;
54、步驟s2,識別,階段性識別模塊根據(jù)路徑跟蹤模塊的輸出,加載相應識別邏輯,處理階段性數(shù)據(jù);
55、步驟s3,調(diào)整與優(yōu)化,當患者醫(yī)療階段變化時,實時調(diào)整模塊調(diào)整識別邏輯;
56、步驟s4,數(shù)據(jù)匯聚與標準化,多源數(shù)據(jù)匯聚模塊從不同系統(tǒng)匯聚并標準化數(shù)據(jù);
57、步驟s5,一致性校驗,異常檢測模塊校驗匯聚數(shù)據(jù),保障跨系統(tǒng)數(shù)據(jù)一致性,并進行異常檢測和修正。
58、與現(xiàn)有技術相比,本發(fā)明具有以下有益效果:
59、本發(fā)明,集成醫(yī)院信息系統(tǒng)his的數(shù)據(jù)流,實時跟蹤識別患者當前所處的醫(yī)療路徑階段(掛號、診斷、結算);針對識別出的路徑階段加載對應的識別模塊,在掛號階段優(yōu)先處理和識別患者的身份和保險信息;在診斷階段優(yōu)先處理識別病史、診斷結果和藥物信息,每個模塊根據(jù)階段的需求進行優(yōu)化。
60、本發(fā)明,在患者路徑發(fā)生變化時,如從檢查階段轉(zhuǎn)入治療階段時,系統(tǒng)實時調(diào)整識別邏輯,自動加載適合當前階段的數(shù)據(jù)處理規(guī)則;同時與醫(yī)院的電子病歷系統(tǒng)emr聯(lián)動,識別模型不斷從電子病歷系統(tǒng)中獲取反饋,自適應識別方法針對不同路徑階段進行精準識別,提高數(shù)據(jù)處理的準確性和效率;同時動態(tài)調(diào)整機制使得系統(tǒng)靈活應對患者路徑的變化,減少數(shù)據(jù)冗余和識別錯誤。
61、本發(fā)明,采用多源數(shù)據(jù)的跨系統(tǒng)一致性校驗機制,從不同的源系統(tǒng)(醫(yī)保系統(tǒng)、emr、lis)匯聚患者的相關數(shù)據(jù),數(shù)據(jù)匯聚過程中進行標準化處理和數(shù)據(jù)清洗,統(tǒng)一不同系統(tǒng)數(shù)據(jù)格式和編碼標準。
62、本發(fā)明,在識別醫(yī)療信息卡數(shù)據(jù)時,自動與匯聚的數(shù)據(jù)實時比對,檢測是否存在不一致;當識別到患者的醫(yī)保信息時,系統(tǒng)會立即與醫(yī)保系統(tǒng)和emr中的相關記錄進行交叉驗證,保障數(shù)據(jù)的一致性和準確性,當系統(tǒng)發(fā)現(xiàn)跨系統(tǒng)數(shù)據(jù)不一致時,會自動觸發(fā)異常檢測模塊,標記出可能存在問題的數(shù)據(jù)條目,并向信息科工作人員發(fā)出警報。
63、本發(fā)明,通過集成多源數(shù)據(jù)的校驗機制,醫(yī)院信息科可以顯著提高數(shù)據(jù)識別的準確性,避免數(shù)據(jù)孤島問題,減少人工比對的工作量和錯誤率,實時校驗與智能糾正機制保證跨系統(tǒng)數(shù)據(jù)的一致性,解決了現(xiàn)有技術中患者就診過程中的不同階段對醫(yī)療信息卡數(shù)據(jù)的需求、處理要求各不相同,單一識別方式缺乏針對性,無法有效區(qū)分不同階段的數(shù)據(jù)需求;同時醫(yī)院信息科所處理數(shù)據(jù)來自多個不同的系統(tǒng),缺乏跨系統(tǒng)的數(shù)據(jù)一致性校驗機制,各系統(tǒng)間數(shù)據(jù)不能有效整合,易導致信息不一致的問題。