成人乱人伦一区二区三区,国产片aⅴ在线观看国语,在线免费观看一级黄片,人人爽人人妻人人做日韩精品,国产一级a毛一级a看免费视频

行業動態 行業動態

分享|能力驗證中離群數據應該怎樣判斷和處理?

2023-03-13 作者: 瀏覽數(shu):1142

離(li)群(qun)數據來源(yuan)與判斷

01

離群值按產生原因(yin)分為兩(liang)類

a)第(di)一類離群(qun)值(zhi)是總體(ti)固有變異(yi)性(xing)的極端表現,這(zhe)類離群(qun)值(zhi)與樣本中其余觀測值(zhi)屬于同一總體(ti);

b)第二類離群值是由(you)于(yu)試(shi)(shi)驗條件和試(shi)(shi)驗方法的(de)(de)(de)偶然偏離所產生的(de)(de)(de)結(jie)果,或產生于(yu)觀測(ce)、記錄、計算中的(de)(de)(de)失誤,這類離群值與樣(yang)本中其余觀測(ce)值不(bu)屬于(yu)同一總體。對離群值的(de)(de)(de)判定通常可(ke)根據技術(shu)上(shang)(shang)或物理(li)上(shang)(shang)的(de)(de)(de)理(li)由(you)直接(jie)進行,例如當試(shi)(shi)驗者(zhe)已經知道試(shi)(shi)驗偏離了規(gui)定的(de)(de)(de)試(shi)(shi)驗方法,或測(ce)試(shi)(shi)儀器發生問題等。當上(shang)(shang)述(shu)理(li)由(you)不(bu)明確時,可(ke)用本標準(zhun)規(gui)定的(de)(de)(de)方法。


02

離群值的三種(zhong)情(qing)形

本(ben)標準在(zai)下述不(bu)同情形(xing)下判斷樣本(ben)中的離(li)群值:

a)上側情(qing)形:根(gen)據實際情(qing)況或(huo)以往(wang)經(jing)驗,離群值(zhi)都(dou)為高端值(zhi);

b)下(xia)側情形:根據實(shi)際情況或以往經驗,離群值都(dou)為低端值;

c)雙(shuang)側情形:根據實際情況(kuang)或以往經驗,離群值可為高端(duan)值,也可為低(di)端(duan)值。


03

檢出離群值個數(shu)的上限

應(ying)規定在樣(yang)本中(zhong)檢出(chu)離(li)(li)群值個數的上(shang)限(xian)(與樣(yang)本量相(xiang)比應(ying)較小),當檢出(chu)離(li)(li)群值個數超(chao)過了這個上(shang)限(xian)時,對此樣(yang)本應(ying)作慎重的研究(jiu)和處(chu)理。


04

單個離群值情形

a)依實際情況或(huo)以往經驗(yan)選定,選定適宜的離群值(zhi)檢(jian)驗(yan)規則(ze)(格拉布斯(si)檢(jian)驗(yan)、狄克(ke)遜檢(jian)驗(yan)等(deng));

b)確定適(shi)當(dang)的顯著性水平(ping);

c)根(gen)(gen)據(ju)顯著性水平(ping)及樣本量(liang)(liang),確定檢驗的臨界值(zhi);d)由(you)觀測值(zhi)計(ji)算相(xiang)應統計(ji)量(liang)(liang)的值(zhi),根(gen)(gen)據(ju)所得(de)值(zhi)與臨界值(zhi)的比(bi)較(jiao)結果(guo)作(zuo)出(chu)判斷(duan)。


05

判(pan)定多(duo)個(ge)離群值(zhi)的(de)檢驗規則(ze)

在允許(xu)檢(jian)(jian)(jian)(jian)(jian)出離(li)群(qun)(qun)值(zhi)(zhi)的(de)個數大于1的(de)情況下,重復使用(yong)檢(jian)(jian)(jian)(jian)(jian)驗(yan)(yan)規則(ze)進行檢(jian)(jian)(jian)(jian)(jian)驗(yan)(yan)。若沒(mei)有檢(jian)(jian)(jian)(jian)(jian)出離(li)群(qun)(qun)值(zhi)(zhi),則(ze)整(zheng)個檢(jian)(jian)(jian)(jian)(jian)驗(yan)(yan)停止;若檢(jian)(jian)(jian)(jian)(jian)出離(li)群(qun)(qun)值(zhi)(zhi),當檢(jian)(jian)(jian)(jian)(jian)出的(de)離(li)群(qun)(qun)值(zhi)(zhi)總數超過(guo)上限(xian)時,檢(jian)(jian)(jian)(jian)(jian)驗(yan)(yan)停止,對此樣本應慎重處理,否則(ze),采用(yong)相同(tong)的(de)檢(jian)(jian)(jian)(jian)(jian)出水平和(he)相同(tong)的(de)規則(ze),對除去(qu)已檢(jian)(jian)(jian)(jian)(jian)出的(de)離(li)群(qun)(qun)值(zhi)(zhi)后余下的(de)觀測值(zhi)(zhi)繼續(xu)檢(jian)(jian)(jian)(jian)(jian)驗(yan)(yan)。


離群值處理(li)

01

處理方(fang)式

處理離群值的方式有:

a)保留離(li)群值并用于后續(xu)數(shu)據處理;

b)在找(zhao)到實際原因時(shi)修正離群值,否則予以保留;

c)剔除離群值,不追加觀測(ce)值;

d)剔(ti)除離群(qun)值(zhi)(zhi),并追加新的(de)觀測(ce)值(zhi)(zhi)或(huo)用適宜的(de)插補值(zhi)(zhi)代替。

格(ge)魯布斯檢驗方法: 

在定量分析實驗(yan)中,實驗(yan)結束(shu)后,必(bi)須對分析數(shu)(shu)據進行處理,在一組分析數(shu)(shu)據中,往往有(you)個別數(shu)(shu)據與其它數(shu)(shu)據相(xiang)差較大,這(zhe)種個別數(shu)(shu)據稱為可疑值。

對可(ke)疑值的(de)處理,應首先回顧和檢查生產可(ke)疑值的(de)實驗過程,有無可(ke)覺察(cha)到的(de)技術(shu)上的(de)異常原(yuan)因。

當原因不(bu)明時,必須按一(yi)定(ding)的數理統(tong)計(ji)方法(fa)進行(xing)處理,決定(ding)是保留還是舍棄。

格魯布斯(si)檢驗法(fa)效果(guo)比較好(hao)的(de)方(fang)法(fa)。格魯布斯(si)檢驗法(fa)的(de)優點(dian)是在(zai)判斷可疑值取(qu)舍的(de)過(guo)程(cheng)(cheng)中(zhong),將(jiang)正態分布中(zhong)的(de)兩(liang)個最重要的(de)參數—平(ping)均(jun)值和(he)標準(zhun)偏差引進來,故方(fang)法(fa)的(de)準(zhun)確性較高。方(fang)法(fa)計算的(de)過(guo)程(cheng)(cheng)是這(zhe)樣的(de):

1.實驗得出一組數(shu)據X1;X2;X3;X4……Xn,懷疑其(qi)中某個數(shu)據可疑(X可疑)

2.計(ji)算X1;X2;X3;X4……Xn 的平均數(X平均)標(biao)準偏差(S)

3.計算格魯(lu)布斯G計算=(X平均(jun)-X可疑(yi))/S,取(qu)絕對值

4.查表(biao)求格(ge)魯布斯G查表(biao)

5.若G計算≥G查(cha)表(biao),則(ze)可(ke)疑數據舍(she)去,反之保留(liu)


02

處理規(gui)則

對(dui)檢出的(de)離(li)群(qun)值,應(ying)盡可能尋找(zhao)其技術(shu)上和物理上的(de)原因(yin),作為處理離(li)群(qun)值的(de)依據。應(ying)根據實際問(wen)題的(de)性質(zhi),權衡尋找(zhao)和判(pan)定(ding)產(chan)生離(li)群(qun)值的(de)原因(yin)所(suo)需代價(jia)、正確判(pan)定(ding)離(li)群(qun)值的(de)得益及錯誤剔除正常觀測值的(de)風險,以(yi)確定(ding)實施(shi)下述三個規(gui)則之一(yi):

a)若在技術上或物理上找到(dao)了產生(sheng)離群(qun)值(zhi)的原因,則應剔(ti)除(chu)或修正(zheng);若未找到(dao)產生(sheng)它(ta)的物理上和技術上的原因,則不得剔(ti)除(chu)或進行修正(zheng)。

b)若在技術上或物理上找到產生(sheng)離群(qun)(qun)值(zhi)(zhi)的原因,則應(ying)剔除或修(xiu)(xiu)正(zheng);否則,保留(liu)歧(qi)離值(zhi)(zhi),剔除或修(xiu)(xiu)正(zheng)統計離群(qun)(qun)值(zhi)(zhi);在重(zhong)復(fu)使用同一(yi)檢(jian)驗規則檢(jian)驗多個離群(qun)(qun)值(zhi)(zhi)的情形(xing),每次(ci)檢(jian)出離群(qun)(qun)值(zhi)(zhi)后,都要再檢(jian)驗它是否為統計離群(qun)(qun)值(zhi)(zhi)。

若(ruo)某次(ci)檢(jian)出的離(li)群(qun)值(zhi)(zhi)(zhi)為統計離(li)群(qun)值(zhi)(zhi)(zhi),則此離(li)群(qun)值(zhi)(zhi)(zhi)及在它前面(mian)檢(jian)出的離(li)群(qun)值(zhi)(zhi)(zhi)(含歧離(li)值(zhi)(zhi)(zhi))都應(ying)被剔除或修正。

c)檢(jian)出的離(li)群值(含歧離(li)值)都(dou)應被剔(ti)除或(huo)進行修正。


03

備案

被剔除或修正的觀測值及其理由應予記(ji)錄(lu),以(yi)備查詢(xun)。


推薦新聞

查看全部 >>
  • 微信咨詢
  • 返回頂部