亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法

文檔序號:6433761閱讀:188來源:國知局
專利名稱:一種基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法
技術(shù)領(lǐng)域
本發(fā)明涉及醫(yī)藥領(lǐng)域的一種基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法。
背景技術(shù)
在藥學(xué)科學(xué)研究以及其他科研領(lǐng)域中,一個普遍存在的情況是,我們測定的一組或多組數(shù)據(jù)中存在一些異常值,那么這些數(shù)據(jù)中的異常值能否舍去?數(shù)學(xué)家已經(jīng)給出了判斷規(guī)則和檢驗標(biāo)準(zhǔn),如格拉布斯檢驗、狄克遜檢驗等。然而,這些檢驗方法的實現(xiàn),需要繁瑣的計算步驟和過程,即“排序——指標(biāo)計算——對比——查臨界值表——對比——決定是否剔除——若剔除則進(jìn)入下一輪新的指標(biāo)計算——對比——查臨界值表——……”,整個過程效率低下且易于出差錯。在實際工作中,格拉布斯檢驗是應(yīng)用較為普遍的方法之一,在計算機技術(shù)高度發(fā)達(dá)的今天,能否基于數(shù)學(xué)家預(yù)設(shè)的檢驗規(guī)則(如格拉布斯規(guī)則),通過一定的方法和程序?qū)崿F(xiàn)批量、快速、準(zhǔn)確、整套的異常值剔除?至今未見有清楚、完整,且可實施的方法的公開報導(dǎo)。

發(fā)明內(nèi)容
針對上述情況,為克服現(xiàn)有技術(shù)之缺陷,本發(fā)明之目的就是提供一種基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法,可有效解決藥學(xué)中數(shù)據(jù)異常值的剔除和藥學(xué)科研領(lǐng)域之外的適宜數(shù)據(jù)組的異常值處理,以保證藥學(xué)測試數(shù)據(jù)的準(zhǔn)確、可靠的問題。本發(fā)明解決的技術(shù)方案是,包括對單組數(shù)據(jù)的異常值循環(huán)剔除和對多組數(shù)據(jù)的批量循環(huán)剔除,前者是主體,后者包含前者,基于格拉布斯矩陣實驗室語言,按照格拉布斯規(guī)則,通過微機和程序,經(jīng)不斷調(diào)試、修改和完善,可快速、有效實現(xiàn)對一組或多組數(shù)據(jù)的異常值循環(huán)剔除,步驟如下
一、對單組數(shù)據(jù)的異常值循環(huán)剔除(名為Grubbs. m)
按照國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋——正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》的處理規(guī)則,通過微機程序,不區(qū)分檢出水平和剔除水平,檢出后直接剔除,剔除后不進(jìn)行插值,每一個循環(huán)最多僅剔除1個,再對剔除后的數(shù)據(jù)(變量)進(jìn)行下一輪檢驗,最后顯示結(jié)果為多輪的累積結(jié)果,方法是首先編制程序,然后輸入原始數(shù)據(jù)及相應(yīng)函數(shù),其中函數(shù)的處理過程包括判斷輸入變量是否符合函數(shù)要求、統(tǒng)一數(shù)據(jù)結(jié)構(gòu)、進(jìn)行數(shù)據(jù)排序、根據(jù)不同的尾數(shù)分別進(jìn)行循環(huán)比較和剔除、整理數(shù)據(jù)結(jié)構(gòu),給出新輸出數(shù)據(jù)等。二、對多組數(shù)據(jù)的批量循環(huán)剔除
按照對單組數(shù)據(jù)的異常值的處理方法,首先判斷輸入的原始數(shù)據(jù)是否符合函數(shù)要求, 若符合,再生成輸出變量的空元胞數(shù)組矩陣后,依次對每組數(shù)據(jù)進(jìn)行單組數(shù)據(jù)的格拉布斯異常值剔除,同時將生成的結(jié)果依次賦給上述元胞數(shù)組相應(yīng)的矩陣,最后給出輸出信息,實現(xiàn)對多組數(shù)據(jù)的批量循環(huán)剔除。本發(fā)明方法快速、準(zhǔn)確,易操作,對于一組或多組測試數(shù)據(jù),可在指定的顯著水平下,以及指定是上側(cè)、下側(cè)還是雙側(cè)檢驗的前提下,快速、準(zhǔn)確、批量地進(jìn)行異常值的多輪循環(huán)剔除,并一次性給出剔除后的新數(shù)據(jù)、剔除的數(shù)據(jù)以及剔除數(shù)據(jù)的序號,可免除手動逐級、逐個、逐組進(jìn)行剔除以及反復(fù)查對臨界值表的繁瑣和易錯,大大提高原始數(shù)據(jù)處理效率,有效用于醫(yī)藥生產(chǎn)、研發(fā)及其他相關(guān)的數(shù)據(jù)測試與分析領(lǐng)域中,保證數(shù)據(jù)的準(zhǔn)確可靠。


圖1為本發(fā)明的單組數(shù)據(jù)的異常值循環(huán)剔除工藝流程圖。圖2為本發(fā)明的多組數(shù)據(jù)異常值的批量循環(huán)剔除工藝流程圖。
具體實施例方式以下結(jié)合附圖對本發(fā)明的具體實施方式
作詳細(xì)說明。首先編制程序,然后再按工藝流程圖進(jìn)行操作,具體步驟是 1、編制程序,方法是
用函數(shù)[Xnew, del, index] =Grubbs (X, alpha, tail),其中 X,alpha, tail 為輸入變量, Xnew, del, index為輸出變量。各變量含義如下
X為輸入原始數(shù)據(jù)的矩陣,或稱測試值的輸入向量,數(shù)據(jù)個數(shù)最多為100個,對數(shù)據(jù)的橫排或豎排無要求,處理后的結(jié)構(gòu)與原結(jié)構(gòu)一致;
alpha是顯著水平值,為0. 01、0. 05,0. 1,默認(rèn)0. 05 ;
tail為尾數(shù)值,包括單側(cè)檢驗尾數(shù)值和雙側(cè)檢驗尾數(shù)值,-1為單側(cè)低值檢驗尾數(shù)值,1 為單側(cè)高值檢驗尾數(shù)值,0為雙側(cè)檢驗尾數(shù)值,默認(rèn)為0 ; Xnew是最終生成的無離群值的向量; del是刪掉的離群值; index是刪掉的離群值的原始編號;
如果輸入的變量數(shù)為1個,則默認(rèn)顯著水平值取0. 05,同時默認(rèn)尾數(shù)為0,即雙側(cè)檢驗; 如果輸入的變量數(shù)為2個,則默認(rèn)尾數(shù)為0,即雙側(cè)檢驗,結(jié)束;
如果輸入的顯著水平不為0.01、0. 05,0. 1中任一個數(shù),則提示輸入備選的顯著水平值 0.01、0.05或0. 1,返回,結(jié)束;
如果輸入的尾數(shù)不為1、-1、0中任一個數(shù),則提示輸入正確的尾數(shù)-1、0或1,返回, 結(jié)束;
統(tǒng)一為列向量[P,q]=size(X),其中P、q是矩陣X的行數(shù)與列數(shù),如果q等于1, [n, m] =Size (X),則將矩陣X的行數(shù)與列數(shù)的值賦給變量η和m,如果ρ等于1,則將矩陣X 進(jìn)行轉(zhuǎn)置X=X',即如果原來是1行20列的矩陣,則變成20行1列的矩陣,[n, m]=size (X), 將矩陣X的行數(shù)與列數(shù)的值賦給變量η和m,結(jié)束;
平行測定的個數(shù)不能大于100,如果平行測定的個數(shù)大于100,超出程序范疇,則返回, 結(jié)束;
構(gòu)建一個nX2的樣本矩陣,N=I 1 :n,N為1,2,3……η的數(shù)列(行向量),將N轉(zhuǎn)置為列向量N=N'。[XS0rt,N]=S0rt(X),將矩陣X中的數(shù)值進(jìn)行由小到大的排序,并將排序后的新矩陣命名為Xs0rt,X0rigin=[N,Xsort],生成一個按樣本編號大小同時排序的“原始”矩陣 Xorigin, Xsort2=Xorigin,Xsort2 與 Xorigin 相同,index=zeros (η, 1),艮口生成一個 η 行 1 列的零矩陣。 臨界值表參照國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋一正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》
I=[10. 90. 950. 9750. 990.丨20000031.1481. 1531.1551.1551.15541.4251. 4631.4811.4921.49651.6021. 6721.7151.7491.76461.7291. 8221.8871.9441.97371.8281. 9382.0202.0972.13981.9092. 0322.1262.2212.274
略去90行
99 3. 014 3. 204 3. 380 3. 597 3. 750
1003.017 3. 207 3. 383 3.600 3. 754];
臨界值表Gtab中,第一列為序號,第一行中0. 9,0. 95,0. 975,0. 99,0. 995為顯著水平, 從第3行至第100行,分別為樣本量為3至100時各顯著水平對應(yīng)的臨界值。中間略去90 行,具體數(shù)據(jù)可參見GB-T4883-2008。如果尾數(shù)為-1,則進(jìn)行低值檢驗,首先找到最小值(第一個),計算統(tǒng)計量 Gi (計算公式參見國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋——正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》中的“O,并比較Gi與臨界值表中相應(yīng)的值(Gs)的相對大小,如果Gi/ (}S>1,則最小值剔除,得到新數(shù)據(jù),再進(jìn)行新數(shù)據(jù)的下一輪循環(huán)比較;否則不進(jìn)行剔除。如果尾數(shù)取1,則進(jìn)行高值檢驗,首先找到最大值(最后一個),計算統(tǒng)計量 Gi (計算公式參見國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋——正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》中的“&”),并比較Gi與臨界值表中相應(yīng)的值(Gs)的相對大小,如果Gi/ (}S>1,則最大值剔除,得到新數(shù)據(jù),再進(jìn)行新數(shù)據(jù)的下一輪循環(huán)比較;否則不進(jìn)行剔除。如果尾數(shù)取0,則進(jìn)行雙側(cè)檢驗,首先找到最小值和最大值,計算統(tǒng)計量Dmax (最大值減去均值^PDmin (均值減去最小值)并比較二者大小,若Dmax/Dmin > 1,則按照上述 “如果尾數(shù)取1,則進(jìn)行高值檢驗,……,,的方式進(jìn)行下一步;否則按上述“如果尾數(shù)為-1, 則進(jìn)行低值檢驗,……”的方式進(jìn)行下一步。如果有數(shù)據(jù)被剔除,則再進(jìn)行新一輪的比較和剔除。最后,再把新生成的ftiew的元素順序調(diào)為原始的、無序的、向量的單列,將新矩陣中的檢測后的數(shù)據(jù)仍按最初輸入時的順序顯示,序號同步,將離群值編號數(shù)列index中為 0的數(shù)值去掉,如果去掉后沒有元素了,則刪掉的離群值為空,即未刪掉離群值,同時所刪掉的離群值的編號也為空,顯示“數(shù)據(jù)組不含溢出值”,返回;如果刪掉為0的元素后還有元素,則對編號進(jìn)行由小到大的排序,b=length(index),b是一共刪掉的數(shù)據(jù)的個數(shù),for c=l:b,c依次取1,2,……b,依次取值,循環(huán)進(jìn)行,找到)(S0rt2的第一列序號中等于c的行號,則該行號所對應(yīng)的Xsort2的第二列數(shù)據(jù)即為所刪除的異常值,結(jié)束循環(huán),轉(zhuǎn)置矩陣,結(jié)束;
最后,如果ρ取1,即初始向量是行向量,則對新生成的矩陣進(jìn)行轉(zhuǎn)置,刪除的異常值的矩陣也進(jìn)行轉(zhuǎn)置,刪除的異常值的序號矩陣也同時進(jìn)行轉(zhuǎn)置。2、對單組數(shù)據(jù)的異常值循環(huán)剔除,方法是,根據(jù)步驟1編制的程序,經(jīng)微機進(jìn)行如下步驟,如圖1所示
Φ首先輸入原始數(shù)據(jù)、顯著水平和尾數(shù)變量,即X,alpha, tail,并輸入函數(shù)Knew,del
,index] =Grubbs(X, alpha, tail)。對于同一組的輸入變量測試數(shù)據(jù),平行測定的數(shù)據(jù)個數(shù)最多為100個,否則返回提示文字“平行測定數(shù)超過100,超出本程序范疇”;
“顯著水平”的值為0. 01,0. 05,0. 1,默認(rèn)為0. 05,按步驟1程序要進(jìn)行該顯著水平是否取0. 01,0. 05、0. 1三個值之一的判斷,如果符合條件,則進(jìn)入下一步,否則提示輸入備選的顯著水平值;
“尾數(shù)”的選值為_1、1、0,默認(rèn)為0,即單側(cè)檢驗和雙側(cè)檢驗的尾數(shù)取值不同,-1為單側(cè)的低值檢驗,1為單側(cè)的高值檢驗,0為雙側(cè)檢驗,根據(jù)步驟1程序要進(jìn)行尾數(shù)是否取_1、0、 1三個值之一的判斷,若符合條件,則進(jìn)入下一步,否則提示輸入正確的尾數(shù);
(2)統(tǒng)一數(shù)據(jù)結(jié)構(gòu)如果原輸入數(shù)據(jù)為列向量,則保持不變;若為行向量,則轉(zhuǎn)置為列向
量,例如,可將原來是1行20列的矩陣,變成20行1列的矩陣;
Θ構(gòu)建一個含有原始序號及原始測試數(shù)據(jù)的矩陣,并按原始數(shù)據(jù)由小到大的排序方式
排序,同時原始序號隨測試數(shù)據(jù)的順序變化而變化,生成新的矩陣備用;
④判斷所輸入的尾數(shù)值
如果尾數(shù)是-1,則進(jìn)行下側(cè)的低值檢驗,首先找到第一個最小值,計算統(tǒng)計量Gi,其數(shù)值與國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋——正態(tài)樣本離群值的判斷和處理(GB-T4883-2008)》中的“P相同,比較Gi與臨界值表中相應(yīng)的值(Gs)的相對大小,如果Gi/Gs>l,則最小值剔除,得到新數(shù)據(jù),再進(jìn)行新數(shù)據(jù)的下一輪循環(huán)比較;否則不進(jìn)行剔除;
如果尾數(shù)是1,則進(jìn)行上側(cè)的高值檢驗,首先找到最后的一個最大值,計算統(tǒng)計量Gi,其數(shù)值與國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋——正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》中的“&”相同,比較Gi與臨界值表中相應(yīng)的值(Gs)的相對大小,如果 Gi/Gs>l,則最大值剔除,得到新數(shù)據(jù),再進(jìn)行新數(shù)據(jù)的下一輪循環(huán)比較;否則不進(jìn)行剔除; 注意,這里的G和Gn計算公式是不同的,具體參見GB-T4883-2008。如果尾數(shù)是0,則進(jìn)行雙側(cè)檢驗,首先找到最小值和最大值,計算統(tǒng)計量Dmax和
Dmin并比較二者大小,若Dmax/Dmin > 1,則按照步驟Φ中尾數(shù)是1的方法進(jìn)行下一步;否
則按步驟④中尾數(shù)是-1的方法進(jìn)行下一步,如果有數(shù)據(jù)被剔除,則再進(jìn)行新一輪的比較和剔除;Θ整理數(shù)據(jù)結(jié)構(gòu),把新矩陣的元素順序調(diào)為原始的順序;如果初始向量是行向量,仍還原為行向量;
⑥給出輸出變量,包括新數(shù)據(jù)、剔除值以及剔除值的序號,如果原始數(shù)據(jù)符合異常值剔除條件,則得到剔除后的新數(shù)據(jù),可對新數(shù)據(jù)繼續(xù)進(jìn)行其他相應(yīng)處理;如果所有數(shù)據(jù)均不符合異常值剔除條件,則數(shù)據(jù)組不含異常值,可直接對原始數(shù)據(jù)繼續(xù)進(jìn)行其他相應(yīng)處理。3、對多組數(shù)據(jù)異常值的批量循環(huán)剔除,方法是,按步驟1編制的程序,按圖2所示, 由以下步驟實現(xiàn)
①首先判斷輸入變量是否符合函數(shù)要求,輸入變量除原始數(shù)據(jù)由數(shù)組向量變?yōu)榫仃囃?,顯著水平、尾數(shù)的要求均同步驟2,原始數(shù)據(jù)矩陣中單組數(shù)據(jù)最大平行測定的個數(shù)為 100,但對組數(shù)沒有限制,但應(yīng)保證原始數(shù)據(jù)矩陣的“行”與“列”與設(shè)計程序時的規(guī)定一致, 否則轉(zhuǎn)置矩陣;
②生成輸出變量的空元胞數(shù)組矩陣,因不同數(shù)據(jù)組最終剔除的值的個數(shù)可能不同,因此未采用矩陣形式,而采用元胞數(shù)組的形式表示;
③依次按步驟2對每組數(shù)據(jù)進(jìn)行單組數(shù)據(jù)的格拉布斯異常值剔除,同時將生成的結(jié)果依次賦給上述元胞數(shù)組相應(yīng)的矩陣;
④給出輸出信息,包括新數(shù)據(jù)最終生成的無離群值的元胞數(shù)組、剔除值元胞數(shù)組以及剔除值的序號元胞數(shù)組,從而得到最終的藥學(xué)測試數(shù)據(jù)。實施例1
對某一中藥一定濃度的煎煮液,由20名健康志愿者按一定標(biāo)準(zhǔn)評價其苦度,得到20 個苦度值(0. 5、0· 6、0· 8、0· 6、0· 5、0· 5、1· 5、0· 8、0· 7、0· 5、2· 2、0· 5、0· 5、0· 8、0· 9、0· 8、0· 6、
0. 8,0. 6,0. 5),由于不同的人味覺存在差異,可能出現(xiàn)一些異常值,需要進(jìn)行剔除。操作方法
首先在矩陣實驗室的命令窗口中輸入原始數(shù)據(jù);
由于人群中可能出現(xiàn)對苦味過度敏感的人,也有可能出現(xiàn)對苦味極不敏感的人,因此采用雙側(cè)檢驗(尾數(shù)值取0),顯著水平取0. 1 ;
輸入按上述算法編好的程序命令,同時將尾數(shù)值、顯著水平的數(shù)值輸入,回車執(zhí)行(保證相應(yīng)的程序已保存在矩陣實驗室相應(yīng)的工作路徑上); 結(jié)果輸出 新矩陣為
刪除的測試數(shù)據(jù)為 [1. 5000 2. 2000] 刪除的測試數(shù)據(jù)的原始序號為 [7 11]即剔除了原第7個數(shù)據(jù)(1. 5)和第11個數(shù)據(jù)(2. 2),即可得到某一濃度中藥的最佳煎煮液。 實施例2
以對某十味中藥一定濃度的煎煮液為例,由20名健康志愿者按一定標(biāo)準(zhǔn)評價其苦度, 得到20 X 10個苦度值矩陣,采用雙側(cè)檢驗,顯著水平取0. 1,操作方法是
首先用微機和步驟1編制的程序,在矩陣實驗室的命令窗口中輸入原始數(shù)據(jù)矩陣;
采用雙側(cè)檢驗(尾數(shù)值取0),顯著水平取0. 1 ;
輸入按上述算法編好的程序命令,同時將尾數(shù)值、顯著水平的數(shù)值輸入,回車執(zhí)行。(請保證相應(yīng)的程序已保存在矩陣實驗室相應(yīng)的工作路徑上) 結(jié)果輸出 數(shù)據(jù)組不含溢出值! 數(shù)據(jù)組不含溢出值! 數(shù)據(jù)組不含溢出值! 數(shù)據(jù)組不含溢出值! 數(shù)據(jù)組不含溢出值! 數(shù)據(jù)組不含溢出值! 新矩陣為 [18x1 double] [18x1 double] [19x1 double] [20x1 double] [20x1 double] [20x1 double] [19x1 double] [20x1 double] [20x1 double](注[20x1 double]表示為20行1列的雙精度數(shù)據(jù)矩陣,余同。) 剔除值矩陣為[2x1 double] [2x1 double] [2.6000] [] [] [] [2] [] [] 剔除值的序號矩陣為 [2x1 double] [2x1 double] [11] [] [] [] [12] [] [] 其中顯示的6句“數(shù)據(jù)組不含溢出值!”,說明10組數(shù)據(jù)中有6組不含異常值。而第2、 3、4、8組數(shù)據(jù)均存在異常值,在矩陣實驗室中打開相應(yīng)矩陣,即可得到相應(yīng)的數(shù)據(jù)。
本發(fā)明在具體實施中,可在Windows運行環(huán)境中,基于矩陣實驗室7. 0版本及以上,將基于上述方法而編寫的相應(yīng)程序的M文件拷入矩陣實驗室的工作路徑。在選定顯著水平以及確定是上側(cè)、下側(cè)還是雙側(cè)檢驗后,即可在矩陣實驗室的命令窗口上輸入原始待檢驗數(shù)據(jù)矩陣,然后運行相應(yīng)命令即可,方便而可行,由上述可知,本發(fā)明對于一組或多組測試數(shù)據(jù),可在指定的顯著水平下,以及指定是上側(cè)、下側(cè)還是雙側(cè)檢驗的前提下,快速、準(zhǔn)確、批量地進(jìn)行異常值的多輪循環(huán)剔除,并一次性給出剔除后的新數(shù)據(jù)、剔除的數(shù)據(jù)以及剔除數(shù)據(jù)的序號,可免除手動逐級、逐個、逐組進(jìn)行剔除以及反復(fù)查對臨界值表的繁瑣和易錯,大大提高原始數(shù)據(jù)處理效率;可有效適用于藥學(xué)科研領(lǐng)域之外的適宜數(shù)據(jù)組的異常值處理;可滿足顯著水平分別為0. 01,0. 05,0. 1三種情況下的操作,可滿足上側(cè)檢驗、下側(cè)檢驗、雙側(cè)檢驗三種情況下的操作,可滿足單組平行數(shù)據(jù)100個及以內(nèi)的異常值剔除操作。多組數(shù)據(jù)同樣,但對組數(shù)一般情況下無限制,可對數(shù)據(jù)進(jìn)行多輪循環(huán)異常值剔除,一輪最多剔除1個異常值,將剔除后的新數(shù)據(jù)進(jìn)行第二輪剔除,以此類推,直到?jīng)]有異常值為止??梢淮涡越o出按原數(shù)據(jù)的順序給出剔除異常值后的新數(shù)據(jù)、剔除的數(shù)據(jù)以及剔除數(shù)據(jù)的序號。 對于單組數(shù)據(jù)的處理,對數(shù)據(jù)的橫排或豎排無要求,處理后的結(jié)構(gòu)與原結(jié)構(gòu)一致。因此,在計算機技術(shù)高度發(fā)達(dá)的今天,該方法不但操作簡便,而且可實現(xiàn)批量、快速、準(zhǔn)確、整套的異常值剔除,為科學(xué)、準(zhǔn)確地進(jìn)行藥學(xué)數(shù)據(jù)測試與分析提供了技術(shù)基礎(chǔ),是醫(yī)藥領(lǐng)域乃至數(shù)據(jù)處理與分析中的一大創(chuàng)新。
權(quán)利要求
1. 一種基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法,其特征在于,由以下步驟實現(xiàn) (1)、編制程序模型,方法是用函數(shù)[Xnew, del, index] =Grubbs (X, alpha, tail),其中 X,alpha, tail 為輸入變量, Xnew, del, index為輸出變量,各變量含義如下X為輸入原始數(shù)據(jù)的矩陣,或稱測試值的輸入向量,數(shù)據(jù)個數(shù)最多為100個,對數(shù)據(jù)的橫排或豎排無要求,處理后的結(jié)構(gòu)與原結(jié)構(gòu)一致;alpha是顯著水平值,為0. 01、0. 05,0. 1,默認(rèn)0. 05 ;tail為尾數(shù)值,包括單側(cè)檢驗尾數(shù)值和雙側(cè)檢驗尾數(shù)值,-1為單側(cè)低值檢驗尾數(shù)值,1 為單側(cè)高值檢驗尾數(shù)值,0為雙側(cè)檢驗尾數(shù)值,默認(rèn)為0 ; Xnew是最終生成的無離群值的向量; del是刪掉的離群值; index是刪掉的離群值的原始編號;如果輸入的變量數(shù)為1個,則默認(rèn)顯著水平值取0. 05,同時默認(rèn)尾數(shù)為0,即雙側(cè)檢驗; 如果輸入的變量數(shù)為2個,則默認(rèn)尾數(shù)為0,即雙側(cè)檢驗,結(jié)束;如果輸入的顯著水平不為0.01、0. 05,0. 1中任一個數(shù),則提示輸入備選的顯著水平值 0.01、0.05或0. 1,返回,結(jié)束;如果輸入的尾數(shù)不為1、-1、0中任一個數(shù),則提示輸入正確的尾數(shù)-1、0或1,返回, 結(jié)束;統(tǒng)一為列向量[P,q]=size(X),其中P、q是矩陣X的行數(shù)與列數(shù),如果q等于1, [n, m] =Size (X),則將矩陣X的行數(shù)與列數(shù)的值賦給變量η和m,如果ρ等于1,則將矩陣X 進(jìn)行轉(zhuǎn)置X=X',即如果原來是1行20列的矩陣,則變成20行1列的矩陣,[n, m]=size (X), 將矩陣X的行數(shù)與列數(shù)的值賦給變量η和m,結(jié)束;平行測定的個數(shù)不能大于100,如果平行測定的個數(shù)大于100,超出程序范疇,則返回, 結(jié)束;構(gòu)建一個nX2的樣本矩陣,Ν=1:1:η,Ν為1,2,3……η的數(shù)列,將N轉(zhuǎn)置為列向量N=N', [Xsort, N] =Sort (X),將矩陣X中的數(shù)值進(jìn)行由小到大的排序,并將排序后的新矩陣命名為 Xsort, Xorigin= [N, Xsort],生成一個按樣本編號大小同時排序的“原始”矩陣Xorigin, Xsort2=Xorigin,Xsort2 與 Xorigin 相同,index=zeros (η, 1),即生成一個 η 行 1 列的零矩陣;臨界值表參照國標(biāo)《數(shù)據(jù)的統(tǒng)計處理和解釋一一正態(tài)樣本離群值的判斷和處理 (GB-T4883-2008)》
全文摘要
本發(fā)明涉及基于格拉布斯規(guī)則和矩陣實驗室語言的藥學(xué)測試數(shù)據(jù)中異常值的剔除方法,可有效解決藥學(xué)中數(shù)據(jù)異常值的剔除和藥學(xué)科研領(lǐng)域之外的適宜數(shù)據(jù)組的異常值處理的問題,方法是,首先編制程序,然后輸入原始數(shù)據(jù)及相應(yīng)函數(shù),按照對單組數(shù)據(jù)的異常值的處理方法,首先判斷輸入的原始數(shù)據(jù)是否符合函數(shù)要求,若符合,再生成輸出變量的空元胞數(shù)組矩陣后,依次對每組數(shù)據(jù)進(jìn)行單組數(shù)據(jù)的格拉布斯異常值剔除,同時將生成的結(jié)果依次賦給上述元胞數(shù)組相應(yīng)的矩陣,最后給出輸出信息,實現(xiàn)對多組數(shù)據(jù)的批量循環(huán)剔除,本發(fā)明方法快速、準(zhǔn)確,易操作,大大提高原始數(shù)據(jù)處理效率。
文檔編號G06F19/00GK102436542SQ20111028346
公開日2012年5月2日 申請日期2011年9月22日 優(yōu)先權(quán)日2011年9月22日
發(fā)明者劉瑞新, 吳子丹, 孫廣科, 施鈞瀚, 李學(xué)林, 陳天朝 申請人:河南中醫(yī)學(xué)院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1