適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法
【專利摘要】本發(fā)明公開了一種適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,包括:S1、對(duì)數(shù)據(jù)采集階段提取的心電圖數(shù)據(jù)的QRS波群的完整性,數(shù)據(jù)存儲(chǔ)與管理階段的數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和時(shí)效性,以及數(shù)據(jù)處理與分析階段的數(shù)據(jù)的分類復(fù)雜度進(jìn)行質(zhì)量檢測(cè),判斷數(shù)據(jù)質(zhì)量是否符合標(biāo)準(zhǔn);S2、當(dāng)數(shù)據(jù)采集階、數(shù)據(jù)存儲(chǔ)與管理階段及數(shù)據(jù)處理與分析階段中的某個(gè)或幾個(gè)的數(shù)據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取相應(yīng)的控制措施以使各個(gè)階段的數(shù)據(jù)符合標(biāo)準(zhǔn);對(duì)于質(zhì)量達(dá)標(biāo)的數(shù)據(jù),提供最合適的分類模型以及數(shù)據(jù)預(yù)處理的建議。本發(fā)明實(shí)現(xiàn)了不同數(shù)據(jù)階段的數(shù)據(jù)質(zhì)量集成控制。
【專利說明】適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息質(zhì)量控制領(lǐng)域,特別涉及一種適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù) 質(zhì)量控制方法。
【背景技術(shù)】
[0002] 根據(jù)國家心血管病中心發(fā)布的《中國心血管病報(bào)告2013》,我國目前心血管疾病 患者人數(shù)高達(dá)2. 9億,每年死于心血管疾病的人數(shù)約350萬人,居各種死因的首位。心血管 疾病具有早期診斷困難、發(fā)病突然、致死率高等特點(diǎn),并嚴(yán)重影響病人的日常生活質(zhì)量。采 用心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)對(duì)病情相對(duì)穩(wěn)定或行動(dòng)不便的病人實(shí)施遠(yuǎn)程家庭監(jiān)護(hù),不僅可以24 小時(shí)監(jiān)測(cè)患者的關(guān)鍵生理參數(shù)以便及早發(fā)現(xiàn)異常并預(yù)警,還可以節(jié)省患者的醫(yī)療費(fèi)用、改 善其生活質(zhì)量、緩解醫(yī)院的床位壓力,以及提高醫(yī)療服務(wù)覆蓋的患者人數(shù)。
[0003] 盡管心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)有著上述的諸多優(yōu)勢(shì),但在我國的使用率和普及率遠(yuǎn)遠(yuǎn) 低于歐美發(fā)達(dá)國家。除了使用成本和配套設(shè)施等方面的原因外,有一個(gè)至關(guān)重要的原因是 缺乏對(duì)這類系統(tǒng)中的數(shù)據(jù)質(zhì)量進(jìn)行控制,監(jiān)測(cè)到的病人生理數(shù)據(jù)因各種原因而產(chǎn)生失真, 導(dǎo)致較高的誤報(bào)警率,使得整個(gè)系統(tǒng)的有效性、實(shí)用性和可信度大大降低。
[0004] 在心血管遠(yuǎn)程監(jiān)測(cè)領(lǐng)域,數(shù)據(jù)質(zhì)量控制技術(shù)主要集中在數(shù)據(jù)采集階段和數(shù) 據(jù)預(yù)處理階段。在數(shù)據(jù)采集階段,傳感器定期自動(dòng)檢測(cè)(self-testing)和自動(dòng)標(biāo)定 (self-calibration)技術(shù)能夠在一定程度上保證傳感器的精度和準(zhǔn)確度。在數(shù)據(jù)預(yù)處理階 段,基于不同生理參數(shù)在時(shí)間、空間或者模式上的相關(guān)性的數(shù)據(jù)預(yù)處理技術(shù)能夠在一定程 度上解決由環(huán)境噪聲或者人為因素而產(chǎn)生的數(shù)據(jù)失真問題。
[0005] 雖然已經(jīng)有不同的方法來控制心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量,但是仍然存在以 下的問題有待解決: 1) 對(duì)心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量缺乏有效的評(píng)估模型; 2) 不同階段的數(shù)據(jù)質(zhì)量控制技術(shù)各自為政,沒有進(jìn)行有效的集成。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的主要目的在于,針對(duì)上述現(xiàn)有技術(shù)中的不足,提供一種適用于心血管遠(yuǎn) 程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法。
[0007] 本發(fā)明解決現(xiàn)有技術(shù)問題所采用的技術(shù)方案是:一種適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng) 的數(shù)據(jù)質(zhì)量控制方法,包括: 51、 對(duì)數(shù)據(jù)采集階段提取的心電圖數(shù)據(jù)的QRS波群的完整性,數(shù)據(jù)存儲(chǔ)與管理階段的 數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和時(shí)效性,以及數(shù)據(jù)處理與分析階段的數(shù)據(jù)的分類復(fù)雜度進(jìn) 行質(zhì)量檢測(cè),判斷數(shù)據(jù)質(zhì)量是否符合標(biāo)準(zhǔn); 52、 當(dāng)數(shù)據(jù)采集階、數(shù)據(jù)存儲(chǔ)與管理階段及數(shù)據(jù)處理與分析階段中的某個(gè)或幾個(gè)的數(shù) 據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取相應(yīng)的控制措施以使各個(gè)階段的數(shù)據(jù)符合標(biāo)準(zhǔn);對(duì)于質(zhì)量達(dá)標(biāo) 的數(shù)據(jù),提供最合適的分類模型以及數(shù)據(jù)預(yù)處理的建議。
[0008] 進(jìn)一步地,所述對(duì)數(shù)據(jù)采集階段提取的心電圖數(shù)據(jù)的QRS波群的完整性進(jìn)行質(zhì)量 檢測(cè)的具體方法為: 依次對(duì)心電圖數(shù)據(jù)進(jìn)行低通濾波、高通濾波、幅值平方、移動(dòng)窗積分、取門限等信號(hào)處 理步驟,提取QRS波群;
【權(quán)利要求】
1. 一種適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,其特征在于,包括: 51、 對(duì)數(shù)據(jù)采集階段提取的心電圖數(shù)據(jù)的QRS波群的完整性,數(shù)據(jù)存儲(chǔ)與管理階段的 數(shù)據(jù)的完整性、一致性、準(zhǔn)確性和時(shí)效性,以及數(shù)據(jù)處理與分析階段的數(shù)據(jù)的分類復(fù)雜度進(jìn) 行質(zhì)量檢測(cè),判斷數(shù)據(jù)質(zhì)量是否符合標(biāo)準(zhǔn); 52、 當(dāng)數(shù)據(jù)采集階、數(shù)據(jù)存儲(chǔ)與管理階段及數(shù)據(jù)處理與分析階段中的某個(gè)或幾個(gè)的數(shù) 據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取相應(yīng)的控制措施以使各個(gè)階段的數(shù)據(jù)符合標(biāo)準(zhǔn);對(duì)于質(zhì)量達(dá)標(biāo) 的數(shù)據(jù),提供最合適的分類模型以及數(shù)據(jù)預(yù)處理的建議。
2. 根據(jù)權(quán)利要求1所述的適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,其特征在 于,所述對(duì)數(shù)據(jù)采集階段提取的心電圖數(shù)據(jù)的QRS波群的完整性進(jìn)行質(zhì)量檢測(cè)的具體方法 為: 依次對(duì)心電圖數(shù)據(jù)進(jìn)行低通濾波、高通濾波、幅值平方、移動(dòng)窗積分、取門限等信號(hào)處 理步驟,提取QRS波群;
如果從采集到的心電圖數(shù)據(jù)中能夠提取完整的QRS波群,則該心電圖數(shù)據(jù)的數(shù)據(jù)質(zhì)量 符合標(biāo)準(zhǔn)。
3. 根據(jù)權(quán)利要求1所述的適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,其特征 在于,所述數(shù)據(jù)存儲(chǔ)與管理階段的數(shù)據(jù)的完整性、準(zhǔn)確性、一致性和時(shí)效性的質(zhì)量檢測(cè)方法 為: 完整性:完整性從屬性和記錄兩個(gè)層面考慮,假設(shè)數(shù)據(jù)集的總記錄數(shù)為K,就屬性層面 而言,對(duì)于第2個(gè)屬性,其取值缺失的記錄數(shù)為Wi ,則該屬性的完整性Cli的計(jì)算公式為:
就記錄層面而言,假設(shè)數(shù)據(jù)集中有屬性缺失的記錄為OT,則數(shù)據(jù)集完整性Cl的計(jì)算 公式為:
完整性Cli和Gl的取值越高,說明數(shù)據(jù)的完整性越好,當(dāng)Cli和超過預(yù)定的門限 值,則該數(shù)據(jù)的完整性達(dá)到標(biāo)準(zhǔn); 準(zhǔn)確性:準(zhǔn)確性從屬性和記錄兩個(gè)層面考慮,假設(shè)數(shù)據(jù)集的總記錄數(shù)為《,就屬性層 面而言,對(duì)于第?個(gè)屬性,其取值與真實(shí)值不符合的記錄數(shù)為t,則該屬性的準(zhǔn)確性為的 計(jì)算公式為:
就記錄層面而言,假設(shè)數(shù)據(jù)集中有屬性取值與真實(shí)值不符合的記錄為是,則數(shù)據(jù)集準(zhǔn) 確性2的計(jì)算公式為:
準(zhǔn)確性和4的取值越高,說明數(shù)據(jù)的準(zhǔn)確性越好,當(dāng)和i超過預(yù)定的門限值, 則該數(shù)據(jù)的準(zhǔn)確性達(dá)到標(biāo)準(zhǔn); 一致性:心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的最終目的是對(duì)被監(jiān)測(cè)者的心臟健康狀況做出準(zhǔn)確判 斷,即實(shí)現(xiàn)準(zhǔn)確的模式分類,從這一角度考慮,數(shù)據(jù)集的一致性體現(xiàn)在各屬性取值相同的記 錄,其類別屬性的取值應(yīng)該一致,假設(shè)數(shù)據(jù)集的總記錄數(shù)為β,各屬性取值相同而類別屬性 取值不一致的記錄數(shù)為w,則數(shù)據(jù)集的一致性C2的計(jì)算公式為:
一致性C2的取值越高,說明數(shù)據(jù)的一致性越好,當(dāng)C2超過預(yù)定的門限值,則該數(shù)據(jù) 的一致性達(dá)到標(biāo)準(zhǔn); 時(shí)效性:時(shí)效性衡量數(shù)據(jù)在真實(shí)世界中發(fā)生變化與這種變化錄入數(shù)據(jù)并影響數(shù)據(jù)使用 之間的時(shí)滯程度,對(duì)于以模式分類為最終使用目的的數(shù)據(jù)集,假設(shè)用于分類模型訓(xùn)練的記 錄數(shù)為,用于該模型驗(yàn)證的記錄數(shù)為W5 ,則數(shù)據(jù)集的實(shí)效性f的計(jì)算公式為:
時(shí)效性7的取值越低,說明數(shù)據(jù)的時(shí)效性約好,當(dāng)Γ低于預(yù)定的門限值,則該數(shù)據(jù)的 時(shí)效性達(dá)到標(biāo)準(zhǔn); 在數(shù)據(jù)存儲(chǔ)與管理階段,當(dāng)用完整性、準(zhǔn)確性、一致性、時(shí)效性組成的數(shù)據(jù)質(zhì)量模型檢 測(cè)數(shù)據(jù)質(zhì)量時(shí),如果其中有兩個(gè)或者兩個(gè)以上的指標(biāo)不達(dá)標(biāo),則說明該數(shù)據(jù)的質(zhì)量不達(dá) 標(biāo)。
4.根據(jù)權(quán)利要求1所述的適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,其特征在 于,所述數(shù)據(jù)處理與分析階段的數(shù)據(jù)的分類復(fù)雜度的質(zhì)量檢測(cè)方法為: 分類復(fù)雜度從數(shù)據(jù)混疊度、數(shù)據(jù)可分性兩個(gè)方面衡量數(shù)據(jù)質(zhì)量是否達(dá)標(biāo),其中,數(shù)據(jù)混 疊度包括最大Fisher判別率(F1)、數(shù)據(jù)取值變化率(F2),而數(shù)據(jù)可分性則包括線性可分性 (L)和非線性可分性(N); (1)最大Fisher判別率(Fl) :F1為數(shù)據(jù)中各屬性的Fisher判別率最大的那個(gè)值,計(jì) 算公式如下:
其中對(duì)于第i個(gè)屬性,Λ,ft,C12,OT22分別指類別1、類別2的均 值與方差,類別1為:心臟健康狀況正常,類別2為心臟健康狀況異常,而 ,=1, 2,…,W,其中m是指屬性的總個(gè)數(shù); 最大Fisher判別率是通過不同類別屬性取值的概率分布情況來衡量數(shù)據(jù)的混疊情 況,F(xiàn)l值越高在一定層面反映了數(shù)據(jù)混疊輕微,可分性好;當(dāng)Fl超過預(yù)定的門限值,則表明 Fl指標(biāo)達(dá)標(biāo); ⑵數(shù)據(jù)取值變化率(F2):設(shè)5Ci) ,min(七sC;.)分別為類別?(例如:心臟 健康狀況正常或者異常)中屬性&的最大、最小取值,則F2的計(jì)算式如下: 數(shù)據(jù)取值變化率: 一一1
金一一 一一:? 其中:
F2是通過不同類別屬性取值的情況來衡量數(shù)據(jù)的混疊程度,F(xiàn)2值越低反映了數(shù)據(jù)混 疊輕微,可分性好;當(dāng)F2低于預(yù)定的門限值,則表明F2指標(biāo)達(dá)標(biāo); (3) 線性可分性(L):用線性分類器:
對(duì)數(shù)據(jù)進(jìn)行分類,數(shù)據(jù)的線性可分性(L)就是該分類器的錯(cuò)分率;L值越低在一定程 度上反映數(shù)據(jù)的線性可分性好;當(dāng)L低于預(yù)定的門限值,則表明L指標(biāo)達(dá)標(biāo); (4) 非線性可分性(N):用非線性分類器(如最近鄰分類器)對(duì)數(shù)據(jù)進(jìn)行分類,數(shù)據(jù)的非 線性可分性(N)就是該分類器的錯(cuò)分率,低的N值在一定程度上反映數(shù)據(jù)的非線性可分性 好;當(dāng)N低于預(yù)定的門限值,則表明N指標(biāo)達(dá)標(biāo); 在數(shù)據(jù)處理與分析階段,用Fl,F(xiàn)2,L,N組成的分類復(fù)雜度檢測(cè)數(shù)據(jù)質(zhì)量時(shí),如果其 中有兩個(gè)或者兩個(gè)以上的指標(biāo)不達(dá)標(biāo),則說明數(shù)據(jù)質(zhì)量不達(dá)標(biāo)。
5.根據(jù)權(quán)利要求1所述的適用于心血管遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)質(zhì)量控制方法,其特征在 于,所述數(shù)據(jù)采集階段的數(shù)據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取的相應(yīng)的控制措施為:會(huì)發(fā)出警告, 要求重新采集數(shù)據(jù),同時(shí)把質(zhì)量不合格的數(shù)據(jù)刪除; 所述數(shù)據(jù)存儲(chǔ)與管理階段的數(shù)據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取的相應(yīng)的控制措施為:會(huì)發(fā) 出警告,要求對(duì)不合格的數(shù)據(jù)采取相應(yīng)的補(bǔ)救措施、或者要求增加新的數(shù)據(jù),同時(shí)刪除不合 格的數(shù)據(jù); 所述數(shù)據(jù)處理與分析階段的數(shù)據(jù)質(zhì)量不符合標(biāo)準(zhǔn)時(shí),采取的相應(yīng)的控制措施為:會(huì)發(fā) 出警告,或者要求增加新數(shù)據(jù),或者提供對(duì)數(shù)據(jù)進(jìn)行補(bǔ)救的建議。
【文檔編號(hào)】G06F19/00GK104462744SQ201410526662
【公開日】2015年3月25日 申請(qǐng)日期:2014年10月9日 優(yōu)先權(quán)日:2014年10月9日
【發(fā)明者】邢延, 蔡延光, 蔡灝, 楊其宇 申請(qǐng)人:廣東工業(yè)大學(xué)