本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,涉及一種心率數(shù)據(jù)質(zhì)量評(píng)估方法。應(yīng)用本發(fā)明可以對(duì)不同人群的心率數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估,有效提高識(shí)別異常心率數(shù)據(jù)的準(zhǔn)確度。
背景技術(shù):
異常數(shù)據(jù)是指數(shù)據(jù)集有部分?jǐn)?shù)據(jù)與整體中其他數(shù)據(jù)相比存在明顯不一致,也稱為異常值、離群值。數(shù)據(jù)異常的產(chǎn)生原因較多,常見的原因有監(jiān)護(hù)系統(tǒng)不穩(wěn)定或者監(jiān)護(hù)對(duì)象人為因素、環(huán)境條件突變或數(shù)據(jù)采集傳感器突然故障等。異常數(shù)據(jù)識(shí)別一般采用的方法有基于模型的方法、基于鄰近度的方法、基于密度的方法等等。
本發(fā)明提供了一種心率數(shù)據(jù)質(zhì)量評(píng)估方法。首先以年齡段為基準(zhǔn)對(duì)用戶的心率數(shù)據(jù)進(jìn)行分類,然后提出數(shù)據(jù)異常假設(shè),提出了改進(jìn)的t檢驗(yàn)法對(duì)心率數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明公開了一種心率數(shù)據(jù)質(zhì)量評(píng)估方法。本發(fā)明以年齡段為基準(zhǔn)對(duì)用戶的心率數(shù)據(jù)進(jìn)行分類,提出數(shù)據(jù)異常假設(shè),提出了一種改進(jìn)的t檢驗(yàn)法對(duì)心率數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量評(píng)估。其具體實(shí)現(xiàn)的步驟如下:
S1:建立心率數(shù)據(jù)模型。心率數(shù)據(jù)基本符合高斯分布:
X~(μ,σ2)
其中,X為數(shù)據(jù)集,μ表示數(shù)據(jù)均值,σ2表示數(shù)據(jù)方差。
S2:提出假設(shè)檢驗(yàn)。假設(shè)H0:xi=xc,H1:xi≠xc。H0:正常值。檢測(cè)數(shù)據(jù)屬于正常誤差范圍內(nèi);H1:異常值。檢測(cè)數(shù)據(jù)不屬于正常范圍內(nèi),需要予以處理。
其中xc為參考值,xi為檢測(cè)數(shù)據(jù),i為檢測(cè)數(shù)據(jù)的序號(hào)(i為正整數(shù))。
S3:分類取樣。隨機(jī)獲得參考樣本Xn={x1,x2,…,xn},n為樣本數(shù)(n為正整數(shù))。
根據(jù)用戶的年齡段把用戶分為嬰兒、少年、青年、壯年、老年等不同的層次,根據(jù)不同的層次對(duì)心率數(shù)據(jù)進(jìn)行分類,采取分類采樣的方式確定檢測(cè)樣本。心率數(shù)據(jù)取樣分類具體描述為:
a)嬰兒。年齡段:0~6歲。
b)少年。年齡段:7~14歲。
c)青年。年齡段:15~25歲。
d)壯年。年齡段:26~65歲。
e)老年。年齡段:66歲或以上。
S4:定義t檢驗(yàn)法的參考值xc。具體描述為:
滿足:
α+β+γ=3
其中,α為樣本平均值的權(quán)值;為樣本平均值;β為樣本中位數(shù)的權(quán)值;xmedian為樣本中位數(shù);γ為樣本眾數(shù)的權(quán)值;xmode為樣本眾數(shù)。
S5:選定t檢驗(yàn)法為檢驗(yàn)統(tǒng)計(jì)方法,計(jì)算xi的統(tǒng)計(jì)量ti。
S6:給出顯著性水平α及臨界值tα/2,根據(jù)|ti|的大小判斷xi是否異常值。
附圖說明
圖1本發(fā)明所述算法流程圖;
圖2心率數(shù)值統(tǒng)計(jì)圖;
圖3心率數(shù)據(jù)質(zhì)量評(píng)估對(duì)比圖;(a)標(biāo)準(zhǔn)t檢驗(yàn)法的統(tǒng)計(jì)量;(b)改進(jìn)的t檢驗(yàn)法的統(tǒng)計(jì)量。
具體實(shí)施方式
下面將結(jié)合本發(fā)明中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
本發(fā)明的具體實(shí)施步驟如下:
Step1:建立心率數(shù)據(jù)模型。心率數(shù)據(jù)基本符合高斯分布:
X~(μ,σ2)
其中,X為數(shù)據(jù)集,μ表示數(shù)據(jù)均值,σ2表示數(shù)據(jù)方差。
Step2:提出假設(shè)檢驗(yàn)。假設(shè)H0:xi=xc,H1:xi≠xc。H0:正常值。檢測(cè)數(shù)據(jù)屬于正常誤差范圍內(nèi);H1:異常值。檢測(cè)數(shù)據(jù)不屬于正常范圍內(nèi),需要予以處理。
其中xc為參考值,xi為檢測(cè)數(shù)據(jù),i為檢測(cè)數(shù)據(jù)的序號(hào)(i為正整數(shù))。
Step3:分類取樣。隨機(jī)獲得參考樣本Xn={x1,x2,…,xn},n為樣本數(shù)(n=10000)。
根據(jù)用戶的年齡段把用戶分為嬰兒、少年、青年、壯年、老年等不同的層次,根據(jù)不同的層次對(duì)心率數(shù)據(jù)進(jìn)行分類,采取分類采樣的方式確定檢測(cè)樣本。心率數(shù)據(jù)取樣分類具體描述為:
a)嬰兒。年齡段:0~6歲。
b)少年。年齡段:7~14歲。
c)青年。年齡段:15~25歲。
d)壯年。年齡段:26~65歲。
e)老年。年齡段:66歲或以上。
Step4:定義t檢驗(yàn)法的參考值xc。具體描述為:
滿足:
α+β+γ=3
其中,α為樣本平均值的權(quán)值;為樣本平均值;β為樣本中位數(shù)的權(quán)值;xmedian為樣本中位數(shù);γ為樣本眾數(shù)的權(quán)值;xmode為樣本眾數(shù)。取α=0.9,β=1.2,γ=0.9。
Step5:選定t檢驗(yàn)法為檢驗(yàn)統(tǒng)計(jì)方法,計(jì)算xi的統(tǒng)計(jì)量ti。具體描述為:
其中,xi為當(dāng)前檢測(cè)值;xc為參考值;n為樣本數(shù);xj為參考樣本Xn={x1,x2,…,xn}。
Step6:給出顯著性水平α及臨界值tα/2,根據(jù)|ti|的大小判斷xi是否異常值。
Step6-1:設(shè)定α=0.01,則tα/2(n-1)≈2.807。
Step6-2:當(dāng)滿足條件時(shí),可判斷檢測(cè)值xi為異常值。判斷條件具體描述為:
|ti|≥tα/2(n-1)
完成以上實(shí)施步驟后,采集心率數(shù)據(jù)可得到圖2所示的心率數(shù)值統(tǒng)計(jì)圖。經(jīng)計(jì)算,得采樣心率數(shù)據(jù)的統(tǒng)計(jì)量,標(biāo)準(zhǔn)t檢驗(yàn)法和改進(jìn)的t檢驗(yàn)法的統(tǒng)計(jì)量如圖3所示。從結(jié)果可看出,本發(fā)明提供了一種有效的心率數(shù)據(jù)質(zhì)量評(píng)估方法。