專(zhuān)利名稱:一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)量測(cè)試領(lǐng)域,具體涉及一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,該方法涉及到數(shù)據(jù)建模、數(shù)據(jù)處理、粗大誤差剔除等方面,用于測(cè)量數(shù)據(jù)誤差處理,適用于數(shù)據(jù)樣本量小,分布不確定的粗大誤差判別。
背景技術(shù):
在測(cè)量過(guò)程中,不可避免的存在誤差。粗大誤差又稱粗差,指在同一測(cè)量條件下多次測(cè)量同一量值時(shí),其中的最大值或最小值等個(gè)別數(shù)據(jù)明顯偏離它所屬樣本的其他數(shù)據(jù),超出在規(guī)定條件下預(yù)期的誤差。含有粗大誤差的測(cè)量值稱為異常值,也稱離群值和壞值。粗大誤差產(chǎn)生的原因可能是人員操作、讀數(shù)或記錄時(shí)的過(guò)失,以及數(shù)據(jù)復(fù)制和計(jì)算處理是 所出現(xiàn)的過(guò)失和錯(cuò)誤,也可能是采樣環(huán)境的變化的部分?jǐn)?shù)據(jù)與原先樣本的模型不符合造成的。在進(jìn)行數(shù)據(jù)處理過(guò)程中,如果將正常數(shù)據(jù)當(dāng)作異常值予以剔除,會(huì)減少有用的信息,會(huì)造成測(cè)量精度偏高的假象;反之,如果對(duì)混有異常值的數(shù)據(jù)未加剔除,必然造成測(cè)量數(shù)據(jù)結(jié)果與實(shí)際不符合。因此在測(cè)量過(guò)程中,一旦發(fā)現(xiàn)異常值就應(yīng)該在記錄中予以剔除,對(duì)測(cè)量數(shù)據(jù)中異常值的合理判斷和處理,是獲得正確測(cè)量結(jié)果的一個(gè)重要前提條件。通常,異常值剔除多采用以下兩類(lèi)方法第一類(lèi)方法是采用統(tǒng)計(jì)方法,按一定的準(zhǔn)則判別而剔除會(huì)歪曲測(cè)量結(jié)果的異常數(shù)據(jù);第二類(lèi),則采用可避免或抑制異常值影響的測(cè)量結(jié)果及其不確定度的穩(wěn)健估計(jì)。基于統(tǒng)計(jì)學(xué)理論的集中常用粗大誤差統(tǒng)計(jì)判別準(zhǔn)則主要包括奈爾(Nair)準(zhǔn)則、格拉布斯(Grubbs)準(zhǔn)則、3 σ準(zhǔn)則、Dixon準(zhǔn)則。在實(shí)際的測(cè)量過(guò)程中,粗大誤差的判別是非常重要和復(fù)雜的。例如,在一些破壞性實(shí)驗(yàn)中,不僅測(cè)量數(shù)據(jù)少,而且其概率分布通常是未知的。在這種情況下,用經(jīng)典統(tǒng)計(jì)學(xué)的方法研究問(wèn)題是相當(dāng)困難的。針對(duì)這種小樣本數(shù)據(jù)提出了新的解決方法,如王中宇等提出利用灰色累加方法確定一個(gè)包羅區(qū)域,王廣林在此基礎(chǔ)上改進(jìn)算法??潞臧l(fā)提出了基于GM(1,1)精度檢驗(yàn)的粗大誤差剔除方法。李登輝研究了基于測(cè)量信息論的小樣本數(shù)據(jù)粗大誤差剔除方法。吳維勇將小波理論應(yīng)用到了數(shù)據(jù)粗大誤差處理方面。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,它針對(duì)測(cè)量數(shù)據(jù)樣本量較少,數(shù)據(jù)分布不明確的特點(diǎn),構(gòu)建了一種描述少數(shù)據(jù)的模型,根據(jù)相應(yīng)的判定法則,實(shí)現(xiàn)粗大誤差的判別。本發(fā)明采用的技術(shù)方案如下一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,其特征在于該方法包括如下步驟步驟一、將采集到的乏信息測(cè)量數(shù)據(jù)序列進(jìn)行預(yù)處理,按由小到大排序;步驟二、利用灰色累加方法得到乏信息測(cè)量數(shù)據(jù)灰色包羅線;步驟三、采用灰色判別法則判定測(cè)量數(shù)據(jù)是否含粗大誤差;步驟四、利用灰色GM(1,I)動(dòng)態(tài)模型獲取乏信息測(cè)量數(shù)據(jù)預(yù)測(cè)值;
步驟五、重復(fù)步驟二、三、四,直至測(cè)量數(shù)據(jù)中粗大誤差全部被判別。其中,步驟二所述的灰色包羅線的獲取,具體實(shí)現(xiàn)過(guò)程如下首先將η個(gè)測(cè)量數(shù)據(jù)從小到大排序,其序列為χ(0)= {χ(0) (1),χ(0) (2),…,χ(0) (η),...} (I)對(duì)Χ(°)作累加生成,得到測(cè)得值累加數(shù)列χ(1)x(l)(k) = f^xm(i) (k = l,2,-,n)(2)
=1測(cè)得值累加曲線以兩條曲線來(lái)包羅,由于測(cè)量數(shù)據(jù)的中值最有可能是最大距離值A(chǔ)max,取測(cè)量次數(shù)的中值P作為下包絡(luò)曲線的轉(zhuǎn)折點(diǎn);另外考慮測(cè)量數(shù)據(jù)有一定程度的變··化,將最大距離值Λ max增加h倍,取常數(shù)h為3. 75,其中
_ | /2當(dāng)η是偶數(shù)時(shí)
P {( + I)/2 當(dāng)η是奇數(shù)時(shí)(3)下包絡(luò)曲線方程為
- Δ
xk - h ~—■ k \< k < ηXiIik) = < _(4)
xk - h 丨!mx {n-l ) ρ < /c < "η-ρ取通過(guò)坐標(biāo)原點(diǎn)(0,0)和測(cè)量列累加終點(diǎn)(η,χω (η))的直線為上包絡(luò)曲線,該參考直線方程為λ二⑷=丄x(1)(n)k =[丄X·ν(0)(i)]k = xk (k = I, 2,...,η) (5)
ηη Ι=1式中]f為測(cè)量數(shù)據(jù)的均值。其中,步驟三所述的灰色包羅粗大誤差判別準(zhǔn)則,具體實(shí)現(xiàn)過(guò)程如下該測(cè)量數(shù)列如果都滿足條件xZ(k) < xn)(k) < xZ(k),I 彡 k 彡 η (6)則認(rèn)定測(cè)量數(shù)據(jù)中不含有粗大誤差,反之則含有。其中,步驟四所述的灰色GM(1,I)動(dòng)態(tài)模型的建立,具體實(shí)現(xiàn)過(guò)程如下設(shè)升序排列后的數(shù)據(jù)序列為x(°) = {x(°) (1),x(°) (2),…,χ(0) (η),···},以序列的前η項(xiàng)作為系統(tǒng)的零時(shí)刻序列,η為時(shí)刻序列長(zhǎng)度,構(gòu)建系統(tǒng)零時(shí)刻的灰色模型;零時(shí)刻數(shù)據(jù)序列為X(l(°) = {x0(0)⑴,Χ(ι(°)⑵,…,Χ(ι(°) (η) I,則其對(duì)應(yīng)的一次累加生成序列為x0(1) = {χ0⑴⑴,X0⑴(2),…,x0(1) (n)} (7)式中,== 1,2,-",n,其緊鄰均值生成序列為
i=lz0(1) = {z0(1) (2),z0(1) (3),... ζ0(1) (η)} (8)式中,C)=金(I·/)(幻+ χβ(1吩-l)),k = 2,3,…,n,零時(shí)刻灰色微分方程為x0(0) (k)+a0z0⑴(k) = b0(9)由式(9)可得,零時(shí)刻灰色微分方程的時(shí)間響應(yīng)序列為
權(quán)利要求
1.一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,其特征在于該方法包括如下步驟 步驟一、將采集到的乏信息測(cè)量數(shù)據(jù)序列進(jìn)行預(yù)處理,按由小到大排序; 步驟二、利用灰色累加方法得到乏信息測(cè)量數(shù)據(jù)灰色包羅線; 步驟三、采用灰色判別法則判定測(cè)量數(shù)據(jù)是否含粗大誤差; 步驟四、利用灰色GM(1,1)動(dòng)態(tài)模型獲取乏信息測(cè)量數(shù)據(jù)預(yù)測(cè)值; 步驟五、重復(fù)步驟二、三、四,直至測(cè)量數(shù)據(jù)中粗大誤差全部被判別。
2.根據(jù)權(quán)利要求I所述的一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,其特征在于步驟二所述的灰色包羅線的獲取,具體實(shí)現(xiàn)過(guò)程如下 首先將η個(gè)測(cè)量數(shù)據(jù)從小到大排序,其序列為
3.根據(jù)權(quán)利要求I所述的一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,其特征在于步驟三所述的灰色包羅粗大誤差判別準(zhǔn)則,具體實(shí)現(xiàn)過(guò)程如下 該測(cè)量數(shù)列如果都滿足條件XiIL ⑷ < -V1)⑷ < X1IL (分),I ≤ k≤ η (6) 則認(rèn)定測(cè)量數(shù)據(jù)中不含有粗大誤差,反之則含有。
4.根據(jù)權(quán)利要求I所述的一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,其特征在于步驟四所述的灰色GM(1,I)動(dòng)態(tài)模型的建立,具體實(shí)現(xiàn)過(guò)程如下 設(shè)升序排列后的數(shù)據(jù)序列為x(°) = {x(0) (1),x(°) (2),…,x(°) (n),…},以序列的前η項(xiàng)作為系統(tǒng)的零時(shí)刻序列,η為時(shí)刻序列長(zhǎng)度,構(gòu)建系統(tǒng)零時(shí)刻的灰色模型;零時(shí)刻數(shù)據(jù)序列為xQ(°) = Ixtl(°)⑴,xQ(°)⑵,…,xQ(°) (η)},則其對(duì)應(yīng)的一次累加生成序列為 χ0ω = {x0(1) (I),χ0(1) (2),…,χ0ω (η)} (7) 式中,
全文摘要
本發(fā)明提供一種基于灰色理論的乏信息測(cè)量數(shù)據(jù)粗大誤差判別方法,該方法的步驟為一、將采集到的乏信息測(cè)量數(shù)據(jù)序列進(jìn)行預(yù)處理,按由小到大排序;二、利用灰色累加方法得到乏信息測(cè)量數(shù)據(jù)灰色包羅線;三、采用灰色判別法則判定測(cè)量數(shù)據(jù)是否含粗大誤差;四、利用灰色GM(1,1)動(dòng)態(tài)模型獲取乏信息測(cè)量數(shù)據(jù)預(yù)測(cè)值;五、重復(fù)步驟二、三、四,直至測(cè)量數(shù)據(jù)中粗大誤差全部被判別。本發(fā)明能實(shí)現(xiàn)概率分布未知,小樣本量等乏信息特征的測(cè)量數(shù)據(jù)粗大誤差的有效判別,測(cè)量數(shù)據(jù)中粗大誤差的有效剔除,保證了測(cè)量結(jié)果的準(zhǔn)確性。本方法合理簡(jiǎn)單,計(jì)算簡(jiǎn)便,大大提高了計(jì)算速度,在快速,在線測(cè)量方面具有很好的推廣應(yīng)用價(jià)值。
文檔編號(hào)G06F17/10GK102945222SQ201210439870
公開(kāi)日2013年2月27日 申請(qǐng)日期2012年11月6日 優(yōu)先權(quán)日2012年11月6日
發(fā)明者王中宇, 王倩, 王巖慶, 李強(qiáng) 申請(qǐng)人:北京航空航天大學(xué)