摘 要:由于计量测试工作属于一项精细工作,它要求得到的各项数据要尽可能准确,因此在通过计量测量得到大量数据后,还应科学,合理的整理数据。为尽可能准确、高效地剔除异常数据,保证测得数据的有效性,本文在阐述了计量测试工作意义的基础上,分析了计量仪器产生误差的原因,研究了测量数据异常值判断准则,并结合本人实际工作经验,总结了剔除方法在应用中应注意的事项,以供同行参考。
关键词:计量测试;意义;异常数据;剔除方法;注意事项
1 计量测试工作的意义
对日常各类生产实践而言,基于使用各种数据的需要,应评估检测仪器,可借助评估结果来对检测仪器的状态能否满足正常使用要求进行判定,检测数据非常重要,只有参照数据,才能判定生产工艺稳定与否,各环节产成品与成品参数符合使用需要与否。通过计量测试工作,可对生产工艺的改进与变革进行指导,促进产品质量的不断提高,若计量测试不准确、不科学,得到的数据就很难令人信服,那么想借助数据控制工艺过程、评定产品质量,持续改善产品质量就很难实现。
2 计量仪器产生误差的原因
从统计学的角度来看,我们通常会把一组重复测量数据中,明显与其它数据有差异的数据称为可疑数据,与组内其它数据差异非常明显是这种数据的主要特点,这一特点也就是我们通常所说的数据发生了变异,那么实际这种变异究竟合理与否,要想得出结论,必须得借助进一步判断。
计量仪器具有一定的高精密性,有严格的外界环境要求。若外界环境变化剧烈,实际计量仪器的测试很可能会有严重偏差出现,造成检测仪器的结果误差较大。一般情况下,下列原因通常会造成计量仪器产生误差:
1)有机械或外界震动冲击检测仪器。
2)电网供电电压发生变化或存在电磁干扰使检测仪器的正常工作受到影响。
3)检测人员工作素质不高,工作技能不达标。工作疏忽、缺乏足够的工作经验,不正当操作。
4)测量仪器自身存在故障,如部分零件存在松动,内部有损坏的电子元件等。
异常值通常偏差正常合理值较大,若在计算中或判定过程中应用了异常值,通常会严重干扰计算结果,对人们正确决策的做出造成影响。因此我们必须尽力把异常值剔除,若在剔除过程中应用的剔除方法不正确,异常值造成的影响不但会很难消除,有时还会误以为测量重复性较好,影响到数据判断的真实性,只有正确剔除异常数据,最终的测量才能与人们的使用需求相符。
3 异常值判断准则
在计量实践中,下列几种准则是我们常用来判断异常值的准则:1)3∑准则;2)格拉布斯准则;3)肖维勒准则;4)t检验法。
虽然以上几种准这的实际内容存在差异,但置信概率在这几种准则中都要用到,置信概率主要指随机变量在置信区间内所落的概率,我们用X表示置信区间内测量数据的实际取值范围,则以上几种准则可进行如下表示:
1)3∑准则:
|Xd-X|>3?滓
这个式子的含义是可疑数据与整组数据算数平均值的差的绝对值比3倍的标准偏差大,则应舍弃此数值。我们可把测得数据代入上式,若符合上式,我们可判定这个值属于异常值,应剔除该值。
2)肖维勒准则:
|Xd-X|>wn·?滓
在使用这个公式时,若独立测量得到的数据,带入上式后,上式成立,则我们可判断异常值为Xd,我们应把Xd剔除。
3)格布拉斯准则:
|Xd-X|≥G(α,n)s
式中,测量数据用Xd表示,s为贝塞尔公式计算的标准差,至于后面的G(α,n)查表可得到。
4)t 检验法。这种检验法主要是把可疑数值Xi外的数值来作为一个数据集合总体,我们可把这个数据集总体假定为正态分布,虽然这只是假定了一个数据分布,到底是正态分布与否,还需进行进一步判定,但在具体应用时,对于样本实际符合正态分布与否通常都不进行深入判定,而将样本近似看做是正态分布,可把可疑数值Xi看作样本总容量为1的一个特殊替,在比较两个总体时,若两者在一个总体中包涵,那么显著差异不应在两者间存在,统计量k便可由此计算出来:
在上式中,我们用表示样本数据算术平均值;s表示样本数据标准差。用计算所得的k值,比较查t分布表所得值,若比较结果比显著性水平a下的t检验值大,则Xi的出现可说明只是一个小概率事件,可把它看作是一个异常值,进而剔除这个值。
4 实例判定
下面我们就结合一个实例来判定一下以上异常值的判断准则:
如:等精度测量某测量量,得到了下列测量数据:10.002,10.204,0.218,
10.228,10.230,10.312,10.320,10.342,10.346,可用以上方法进行判断并把异常值剔除,置信概率可取为95%,也就是α=0.05。
我们怀疑异常值为10.346。
通过计算可得:这十个数的平均值为10.2317,X1的平均值为10.2231,δ=0.0912,s=0.0888。
综合计算异常值为10.346,应把10.346剔除。
5 结语
在实际应用中,为确保测试精度的足够,避免误判现象的出现,可对以上判定准则的两种或三种进行综合,同时判断,如果应用的这几种判定方法,出现一致的结论,则应把可疑数据剔除,这样可使判断的可靠性得到大幅提升,而若应用这几种方法后出现了不一致的判定结果,则对应剔除的数据必须进行慎重考虑,再次进行验证,对于这种情况,笔者建议保留处理数据。这有这样才能准确、高效地剔除异常数据,保证测得数据的有效性。
参考文献:
[1] 林洪桦.剔除异常数据的稳健性处理方法[J].中国计量学院学报,2004(01).
[2] 债业泰.误差理论与数据处理[M].机械工业出版社,2005.
[3] 秦树人.机械工程测试原理及技术[M].重庆大学出版社,2002.
作者简介:杨绪(1989-),女,满族,辽宁省抚顺市抚顺县人,朝阳市计量测试所,助理工程师,学士学位,研究方向:流量;王兴龙(1989-),男,蒙古族,辽宁省朝阳市喀左县人,朝阳市计量测试所助理工程师,学士学位,研究方向:力学。
相关热词搜索: 剔除 计量 异常 探讨 方法