计量论坛

 找回密码
 成为会员

QQ登录

只需一步,快速开始

搜索
查看: 2663|回复: 1

[数据] 请教:当出现三次极值时,难道Dixon就无法当做异常值剔除?

[复制链接]
发表于 2017-5-9 23:41:09 | 显示全部楼层 |阅读模式

立刻注册计量论坛 交流工作中的点滴

您需要 登录 才可以下载或查看,没有账号?成为会员

x
本论坛的罗曼先生问了一个问题,Dixon准则中的极值是不是观测值。
今晚我把Dixon先生当初的论文看了一遍,又找了几本资料,人家的确是观测值,只不过Dixon的观测值排列是随序号严格单调递增的。
但是我们的考题和日常中经常出现一些等值情况,这个时候把n看做观测次数我觉得会出现极为荒谬的事情:
比如,设备检测值未0.02%,0.03%,0.02%......0.02%,0.05%,2000%
最后的数值明显不对头了,假设大于50次测量中,2000%(或其他已经鬼知道的数值)出现了三次,那么Xn-Xn-2恒为0,故γ恒为0,γ恒≤γ‘,那些鬼知道的数值恒为正常值,岂不是无论是几都无法按照迪克逊准则进行剔除?这个时候已经不是近似正态分布说事的时候了,可是还要守着统计剔除法么?
物理辨别法也不能用,这岂不是很荒谬?请于指惑,谢谢
发表于 2017-5-11 10:59:27 | 显示全部楼层
GB/T 4883-2008 数据的统计处理和解释正态样本离群值的判断和处理,中给出了适用范围。您的例子,假设极值2000%出现3次,如果是正常的正态分布(假设真的是测量结果,那必然要先确认测量过程的,但这里只考虑数学问题),a为0.05时,出现3个2000%的概率微乎其微0.05*0.05*0.05。

那么准则中a值的含义就很能说明问题了。当一个值使用狄克逊准则D(α,n),a=0.05时被判为离群值该如何解说呢?此值有95%的概率为离群值?不被狄克逊准则判异就一定不是异常值嘛? 这和不确定度应该应该差不多,比如一个测量值的测量结果和不确定度为A=10+/-1 (k=2),那么你只能说真值有95%的概率在9~11,真值可能等于2000嘛?如果按正态分布,那是有可能啊,只是概率很低很低呗。

我估计,狄克逊准则统计判断离群值,应该和SPC控制图类似,存在误判的可能,而且判误的概率可能都是可以准确计算出来的。
您需要登录后才可以回帖 登录 | 成为会员

本版积分规则

小黑屋|手机版|Archiver|计量论坛 ( 闽ICP备06005787号-1—304所 )
电话:0592-5613810 QQ:473647 微信:gfjlbbs闽公网安备 35020602000072号

GMT+8, 2024-4-26 18:27 , Processed in 0.041046 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表